Was ist neu in Actian DataFlow Version 6.6.1?
Actian Germany GmbH
November 26, 2018

Actian DataFlow ist eine parallele Workflow-Plattform für den durchgängigen Datenzugriff, die Transformation, die Aufbereitung und die prädiktive Analyse, die Leistungsengpässe in Ihren datenintensiven Anwendungen beseitigt. Ergänzend zur Actian Vector Analytics Database nutzt DataFlow Zustimmung, Parallelität und Pipelining, um die Datenbewegung zwischen den einzelnen Stellen Ihrer Datenarchitektur zu beschleunigen und so schnellere Ergebnisse zu erzielen. DataFlow beseitigt Speicherbeschränkungen sowie die Notwendigkeit, Daten in bestimmte Datenspeicher zu verschieben, bevor die Analysen ausgeführt werden. DataFlow erkennt die verfügbaren Ressourcen, bevor es die Ausführung in kleinere Teile aufteilt, die parallel ausgeführt werden können, um die Vorteile der horizontalen und vertikalen Skalierung optimal zu nutzen.
DataFlow kombiniert die visuelle Drag-and-Drop-Workflow-Umgebung von KNIME ( data mining ) mit der zugrundeliegenden Actian DataFlow-Plattform, um eine bessere Kontrolle über den gesamten Prozess des Einlesens der Daten, der Durchführung der Transformation und der Analysefunktionen sowie des Schreibens der Ergebnisse zu ermöglichen.
Was ist neu in Version 6.6.1?
Dieses Update für DataFlow zertifiziert neue Versionen der beliebtesten Hadoop-Distributionen von Apache, Cloudera, Hortonworks und MapR und verbessert die Funktionen für paralleles Laden mit den neuesten Versionen von Vector für Linux, Windows und Hadoop. Außerdem werden fünf neue Datentypen mit DataFlow unterstützt, um eine größere Vielfalt an Datenformaten zu verarbeiten. Hier ist die genaue Liste:
- Unterstützung für Apache Hadoop 3.0.1+ wurde hinzugefügt.
- Unterstützung für MapR 6.0.1 wurde hinzugefügt.
- Verifizierte Unterstützung für MapR 5.2.2.
- Aktualisierte Unterstützung für Hortonworks HDP 2.6.
- Aktualisierte Unterstützung für Cloudera CDH 5.15.
- Der direkte Vektorlader wurde aktualisiert, damit er mit den neuesten Vector & VectorH (5.0 & 5.1) funktioniert.
- Unterstützung für 5 neue Basistypen hinzugefügt: Geld, ip4, ip6, uuid und Intervalle (Perioden und Dauern).
- Unterstützung für die neueste AWS-Authentifizierungsbibliothek (1.11 vorher 1.3) wurde hinzugefügt.
- Unterstützung für logische Pfade in Hadoop hinzugefügt.
DataFlow-Ergebnisse:
Bei der Datenvorbereitung, dem Daten-Onboarding und ETL-Anwendungsfällen kann DataFlow den Prozess um den Faktor 20 oder mehr beschleunigen. Bei einem Kunden, der zuvor 17 Stunden für die Aufbereitung und Bereinigung von Daten für das Onboarding neuer Kunden benötigte, reduzierte DataFlow die Zeit auf 43 Minuten, also fast 24 Mal schneller. Ein anderer Kunde nutzte DataFlow, um seinen Datentransferprozess zu parallelisieren und in eine Pipeline einzubinden und so die Bearbeitungszeit von über 30 Stunden auf nur 20 Minuten zu reduzieren, was einer 90-fachen Beschleunigung entspricht. In einem dritten Beispiel hat DataFlow gezeigt, dass es 500.000 Datensätze in sieben Sekunden in eine Oracle-Datenbank laden kann, gegenüber einer vorherigen Laufzeit von mehr als 3 Minuten. Wenden Sie sich an results@actian.com, wenn Sie an einer Demonstration interessiert sind.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.