Actian Entwickler-Tools auf Github verfügbar
Actian Germany GmbH
April 28, 2016

Die Technologie-Teams von Actian haben kürzlich eine Reihe von technischen Tools und Snippets auf dem ActianAccount auf Github veröffentlicht, die für Kunden, Partner und Interessenten von Interesse sein werden. Wir ermutigen Sie alle, einen Blick darauf zu werfen und eigene Beiträge zu leisten - entweder um diese Tools zu verbessern oder um uns über andere Tools zu informieren, die Sie für sich selbst erstellt haben. Wir beabsichtigen, hier im Laufe der Zeit neue Beiträge zu veröffentlichen und in zukünftigen Blogeinträgen auf einige dieser Tools und Beiträge näher einzugehen.
Beispiele für Projekte, die Sie bereits auf GitHub finden können, sind:
- Der Actian Spark Konnektor für Vector in Hadoop (VectorH) wird hier gepflegt.
- Ein Vagrant-Paket, das eine heruntergeladene Vector .tgz-Datei automatisch in eine frisch erstellte virtuelle CentOS-Maschine installiert.
- Ein Unit Testing Framework für OpenROAD.
- Eine Sammlung von Skripten zum Testen von VectorH zusammen mit anderen Hadoop-Datenanalyse-Engines, auf die im Rahmen eines bevorstehenden Konferenzpapiers verwiesen wird.
- Eine Maven-basierte Vorlage zur Erstellung neuer benutzerdefinierter Operatoren in Dataflow, zusammen mit einer Reihe von Beispielen, die diese Vorlage verwenden, einschließlich eines Dataflow JSONpath Expression Parsers und eines XML und XPath Parsers.
- Ein Dienstprogramm namens MQI, das die Ausführung eines Betriebssystembefehls auf allen Knoten in einem Cluster erleichtern soll.
- Eine Sammlung kleiner Vector Tools, die z.B. die angemessene Standardanzahl von Partitionen für eine große Tabelle berechnen, nach Datenschieflage innerhalb einer Tabelle suchen, prüfen, ob die Min/Max-Indizes von Vector sortiert sind oder nicht (bessere Leistung, wenn Ihre Daten auf der Festplatte sortiert sind und die Min/Max-Indizes dies anzeigen), und auch ein Tool, das eine Sammlung von SQL-Skripten nimmt und sie in einen gleichzeitigen Nutzer verwandelt, komplett mit einigen Statistiken zur Gesamtlaufzeit.
- Eine Sammlung neuer Operatoren für Dataflow, um Operationen wie die Übergabe von Laufzeitparametern in einen Dataflow als Dienst zu implementieren, und ein 'sesssionize'-Operator, um zeitgestempelte Daten in 'Sessions' zu gruppieren, und ein Lead/Lag-Knoten für die Handhabung von zeitgestempelten Daten, und verschiedene andere.
- Eine Performance-Benchmark-Test-Suite für Actian Vector, basierend auf den DBT3-Testdaten und -Abfragen. Dieses Projekt erstellt Testdaten mit einem von Ihnen gewählten Skalierungsfaktor (Standardwert ist Skalierungsfaktor 1, was insgesamt etwa 1 GB Daten entspricht), lädt diese Testdaten in Vector/VectorH und führt dann eine Reihe von Abfragen aus, um die Ergebnisse zu messen.
Bitte schauen Sie es sich an, laden Sie es herunter und tragen Sie dazu bei, es zu erweitern und zu verbessern, um Ihre Bedürfnisse kennenlernen !
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.