Datenmanagement

Actian Entwickler-Tools auf Github verfügbar

Actian Germany GmbH

April 28, 2016

Actian Entwickler-Tools auf github verfügbar

Die Technologie-Teams von Actian haben kürzlich eine Reihe von technischen Tools und Snippets auf dem ActianAccount auf Github veröffentlicht, die für Kunden, Partner und Interessenten von Interesse sein werden. Wir ermutigen Sie alle, einen Blick darauf zu werfen und eigene Beiträge zu leisten - entweder um diese Tools zu verbessern oder um uns über andere Tools zu informieren, die Sie für sich selbst erstellt haben. Wir beabsichtigen, hier im Laufe der Zeit neue Beiträge zu veröffentlichen und in zukünftigen Blogeinträgen auf einige dieser Tools und Beiträge näher einzugehen.

Beispiele für Projekte, die Sie bereits auf GitHub finden können, sind:

  • Der Actian Spark Konnektor für Vector in Hadoop (VectorH) wird hier gepflegt.
  • Ein Vagrant-Paket, das eine heruntergeladene Vector .tgz-Datei automatisch in eine frisch erstellte virtuelle CentOS-Maschine installiert.
  • Ein Unit Testing Framework für OpenROAD.
  • Eine Sammlung von Skripten zum Testen von VectorH zusammen mit anderen Hadoop-Datenanalyse-Engines, auf die im Rahmen eines bevorstehenden Konferenzpapiers verwiesen wird.
  • Eine Maven-basierte Vorlage zur Erstellung neuer benutzerdefinierter Operatoren in Dataflow, zusammen mit einer Reihe von Beispielen, die diese Vorlage verwenden, einschließlich eines Dataflow JSONpath Expression Parsers und eines XML und XPath Parsers.
  • Ein Dienstprogramm namens MQI, das die Ausführung eines Betriebssystembefehls auf allen Knoten in einem Cluster erleichtern soll.
  • Eine Sammlung kleiner Vector Tools, die z.B. die angemessene Standardanzahl von Partitionen für eine große Tabelle berechnen, nach Datenschieflage innerhalb einer Tabelle suchen, prüfen, ob die Min/Max-Indizes von Vector sortiert sind oder nicht (bessere Leistung, wenn Ihre Daten auf der Festplatte sortiert sind und die Min/Max-Indizes dies anzeigen), und auch ein Tool, das eine Sammlung von SQL-Skripten nimmt und sie in einen gleichzeitigen Nutzer verwandelt, komplett mit einigen Statistiken zur Gesamtlaufzeit.
  • Eine Sammlung neuer Operatoren für Dataflow, um Operationen wie die Übergabe von Laufzeitparametern in einen Dataflow als Dienst zu implementieren, und ein 'sesssionize'-Operator, um zeitgestempelte Daten in 'Sessions' zu gruppieren, und ein Lead/Lag-Knoten für die Handhabung von zeitgestempelten Daten, und verschiedene andere.
  • Eine Performance-Benchmark-Test-Suite für Actian Vector, basierend auf den DBT3-Testdaten und -Abfragen. Dieses Projekt erstellt Testdaten mit einem von Ihnen gewählten Skalierungsfaktor (Standardwert ist Skalierungsfaktor 1, was insgesamt etwa 1 GB Daten entspricht), lädt diese Testdaten in Vector/VectorH und führt dann eine Reihe von Abfragen aus, um die Ergebnisse zu messen.

Bitte schauen Sie es sich an, laden Sie es herunter und tragen Sie dazu bei, es zu erweitern und zu verbessern, um Ihre Bedürfnisse kennenlernen !

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.