Integration von Daten

Was ist der Unterschied zwischen ETL und IPaaS?

Traci Curran

Juli 9, 2020

ETL und iPaaS

ETL (Extrahieren, Übertragen und Laden) und IPaaS (Integration Platform as a Service) sind Datenintegrationsmethoden, um verschiedene IT-Systeme und Datenquellen miteinander zu verbinden. Während ETL eine Reihe von Techniken zum Verschieben von Daten ist, ist IPaaS eine ganzheitlichere Reihe von Funktionen zum Verschieben und Integrieren von Daten zwischen IT-Systemen. IPaaS wird oft als Nachfolger oder "nächste Generation" von ETL-Tools angesehen, die für den Einsatz in modernen Cloud optimiert sind.

Die digitale Transformation der Wirtschaft hat zu einem rasanten Anstieg der Anzahl verschiedener IT-Systeme geführt, die ein Unternehmen zur Unterstützung seiner Geschäftsprozesse einsetzt. Viele der modernen Systeme, die von Geschäftsanwendern übernommen werden, sind SaaS-Lösungen und Plattformen, die von Dritten betrieben werden. Diese externen Systeme werden mit internen Systemen kombiniert (die entweder von der IT-Abteilung Ihres Unternehmens entwickelt oder in den Rechenzentren Ihres Unternehmens installiert wurden) und bilden das Rückgrat für eine Reihe von technologiegestützten Geschäftsprozessen. Der Erfolg oder Misserfolg von Initiativen zur digitalen Transformation hängt oft von der Effektivität Ihrer IT-Abteilung bei der Verwaltung der Integrationen und des Datenflusses zwischen den verschiedenen Systemen ab, die Ihr Unternehmen nutzt.

Was ist ETL?

Bei der Datenintegration werden hauptsächlich zwei Entwurfsmuster verwendet. Das erste ist die Datenreplikation. Hier kommt ETL ins Spiel. Traditionelle Geschäftsprozesse basieren auf dem Konzept unabhängiger Prozessschritte, ähnlich wie die Stationen eines Fließbandes. Etwas wird an einem Ort erstellt und dann zur nächsten Station in der Reihe weitergereicht. Als die IT-Systeme ursprünglich eingeführt wurden, waren sie so konzipiert, dass sie diesen Wertschöpfungsprozess nachbilden. Die Daten werden in einem System erstellt und dann repliziert oder in nachgelagerte Systeme verschoben, wo sie für etwas anderes verwendet werden. ETL war eine bahnbrechende Methode, als sie zum ersten Mal eingeführt wurde und die Integration von Systemen verschiedener Anbieter sowie die Möglichkeit ermöglichte, Betriebsdaten zur Archivierung, Analyse und Berichterstattung in ein Data Warehouse zu kopieren.

Bei der ETL-Verarbeitung gibt es zwei Herausforderungen, die Unternehmen schnell erkannt haben. Die erste ist das exponentielle Wachstum der Daten und die damit verbundenen Speicherkosten. Wenn Sie 100 Datensätze in einem Quellsystem haben und durch ETL-Prozesse diese Daten in zehn nachgelagerte Systeme replizieren, müssen Sie die 10-fache Menge an Daten speichern und pflegen. Das zweite Problem besteht darin, die replizierten Daten aktuell zu halten. Bei den meisten ETL-Vorgängen handelt es sich um eine so genannte "Stapelverarbeitung", bei der eine Gruppe von Transaktionen in eine Warteschlange gestellt und in regelmäßigen Abständen nachgelagert wird. Dies ist vergleichbar mit der Post, die sich in einem Briefkasten stapelt und die der Briefträger einmal am Tag abholt und verteilt. Die Stapelverarbeitung funktionierte gut in einer Umgebung, in der Geschäftsprozesse stark manuell geprägt waren und über mehrere Tage oder Wochen hinweg ausgeführt wurden. Von modernen digitalen Geschäftsprozessen wird erwartet, dass sie in Echtzeit ablaufen und oft innerhalb von Minuten oder Stunden vollständig abgeschlossen sind.

IPaaS - ein moderner Ansatz für die Integration

Integration Platform as a Service (IPaaS) ist ein moderner Satz von Funktionen. Der "as a Service"-Teil des Namens impliziert, dass die Integrationsplattform eine spezielle Art von Software ist, die in der Cloud gehostet und über ein Abonnement bereitgestellt wird. Actian DataConnect ist ein Beispiel für IPaaS. IPaaS umfasst die Funktionen von ETL (sowie ELT) für die Batch-Verarbeitung, bietet aber auch Funktionen für die Echtzeit-Transaktionsintegration - und spielt damit die Rolle einer "Datendrehscheibe" oder "Datenstruktur" für das Unternehmen. Einige IPaaS-Lösungen können auch On-Premises betrieben werden oder eine Brücke zwischen On-Premises und Cloud Systemen schlagen. Diese werden als "hybride IPaaS"-Lösungen bezeichnet.

Der große Unterschied zwischen ETL und IPaaS besteht in der Fähigkeit, Daten in Echtzeit zu integrieren. Digital transformierte Geschäftsprozesse sind stark von Technologie abhängig, um Produktivität und Effizienz zu ermöglichen, sowie von Daten zur Entscheidungsfindung. IPaaS-Lösungen bieten die Funktionen , um alle Ihre IT-Systeme miteinander zu verbinden und die orchestrierte Bewegung von Daten in Ihrem Unternehmen zu ermöglichen - sei es die Verarbeitung von Transaktionen in Echtzeit, operative Analysen zur Prozesssteuerung oder die Bewegung von Daten in Ihr Data Warehouse zur Archivierung undData Analytics.

Moderne Unternehmen brauchen die Flexibilität, die IPaaS bietet. Actian DataConnect iPaaS ist eine vielseitige hybride Integrationsplattform, die die Funktionen bietet, die Ihr Unternehmen benötigt, um Ihre IT-Systeme zu verbinden - mit Werkzeugen für ein sicheres, skalierbar und agiles Management Ihrer Daten überall und jederzeit. Um mehr zu erfahren, besuchen Sie www.actian.com/dataconnect.

Kopfbild von Traci Curran

Über Traci Curran

Traci Curran ist als Director of Product Marketing bei Actian tätig und konzentriert sich auf die Actian Data Platform. Mit mehr als 20 Jahren Erfahrung im Technologiemarketing war Traci Curran zuvor in leitenden Marketingpositionen bei CloudBolt Software, Racemi (von der DXC Corporation übernommen) sowie bei einigen der innovativsten Startups der Welt tätig. Tracis Leidenschaft ist es, Kunden dabei zu helfen, zu verstehen, wie sie Innovationen beschleunigen und Wettbewerbsvorteile erzielen können, indem sie die digitale Transformation und Cloud nutzen.