Datenmanagement

Actian Entwickler-Tools auf Github verfügbar

Actian Germany GmbH

April 28, 2016

Actian Entwickler-Tools auf github verfügbar

Die Technologie-Teams von Actian haben kürzlich eine Reihe von technischen Tools und Snippets auf dem ActianAccount auf Github veröffentlicht, die für Kunden, Partner und Interessenten von Interesse sein werden. Wir ermutigen Sie alle, einen Blick darauf zu werfen und eigene Beiträge zu leisten - entweder um diese Tools zu verbessern oder um uns über andere Tools zu informieren, die Sie für sich selbst erstellt haben. Wir beabsichtigen, hier im Laufe der Zeit neue Beiträge zu veröffentlichen und in zukünftigen Blogeinträgen auf einige dieser Tools und Beiträge näher einzugehen.

Beispiele für Projekte, die Sie bereits auf GitHub finden können, sind:

  • Der Actian Spark Konnektor für Vector in Hadoop (VectorH) wird hier gepflegt.
  • Ein Vagrant-Paket, das eine heruntergeladene Vector .tgz-Datei automatisch in eine frisch erstellte virtuelle CentOS-Maschine installiert.
  • Ein Unit Testing Framework für OpenROAD.
  • Eine Sammlung von Skripten zum Testen von VectorH zusammen mit anderen Hadoop-Datenanalyse-Engines, auf die im Rahmen eines bevorstehenden Konferenzpapiers verwiesen wird.
  • Eine Maven-basierte Vorlage zur Erstellung neuer benutzerdefinierter Operatoren in Dataflow, zusammen mit einer Reihe von Beispielen, die diese Vorlage verwenden, einschließlich eines Dataflow JSONpath Expression Parsers und eines XML und XPath Parsers.
  • Ein Dienstprogramm namens MQI, das die Ausführung eines Betriebssystembefehls auf allen Knoten in einem Cluster erleichtern soll.
  • Eine Sammlung kleiner Vector Tools, die z.B. die angemessene Standardanzahl von Partitionen für eine große Tabelle berechnen, nach Datenschieflage innerhalb einer Tabelle suchen, prüfen, ob die Min/Max-Indizes von Vector sortiert sind oder nicht (bessere Leistung, wenn Ihre Daten auf der Festplatte sortiert sind und die Min/Max-Indizes dies anzeigen), und auch ein Tool, das eine Sammlung von SQL-Skripten nimmt und sie in einen gleichzeitigen Nutzer verwandelt, komplett mit einigen Statistiken zur Gesamtlaufzeit.
  • Eine Sammlung neuer Operatoren für Dataflow, um Operationen wie die Übergabe von Laufzeitparametern in einen Dataflow als Dienst zu implementieren, und ein 'sesssionize'-Operator, um zeitgestempelte Daten in 'Sessions' zu gruppieren, und ein Lead/Lag-Knoten für die Handhabung von zeitgestempelten Daten, und verschiedene andere.
  • Eine Performance-Benchmark-Test-Suite für Actian Vector, basierend auf den DBT3-Testdaten und -Abfragen. Dieses Projekt erstellt Testdaten mit einem von Ihnen gewählten Skalierungsfaktor (Standardwert ist Skalierungsfaktor 1, was insgesamt etwa 1 GB Daten entspricht), lädt diese Testdaten in Vector/VectorH und führt dann eine Reihe von Abfragen aus, um die Ergebnisse zu messen.

Bitte schauen Sie es sich an, laden Sie es herunter und tragen Sie dazu bei, es zu erweitern und zu verbessern, um Ihre Bedürfnisse kennenlernen !

actian avatar logo

Über Actian Corporation

Actian versetzt Unternehmen in die Lage, Daten in großem Umfang sicher verwalten und zu steuern, komplexe Datenumgebungen zu optimieren und die Bereitstellung von KI-fähigen Daten zu beschleunigen. Der Data-Intelligence-Ansatz von Actian kombiniert Daten-Discovery, Metadaten und föderierte Governance, um eine intelligentere Datennutzung zu ermöglichen und die Compliance zu verbessern. Mit intuitivenFunktionen können geschäftliche und technische Anwender Datenbestände in Cloud, Hybrid- und On-Premises finden, verstehen und ihnen vertrauen. Actian liefert flexible Datenmanagement an 42 Millionen Nutzer in Fortune-100-Unternehmen und anderen Unternehmen weltweit und erreicht dabei eine Kundenzufriedenheit von 95%.