Daten-Intelligenz

Daten-Revolutionen: Auf dem Weg zu einer Unternehmensvision für Daten

Actian Germany GmbH

19. August 2019

Datenumdrehungen

Die Nutzung von Massendaten durch die Internetgiganten in den 2000er Jahren war ein Weckruf für die Unternehmen: Big Data ist ein Hebel für Wachstum und Wettbewerbsfähigkeit, der die Innovation fördert. Heute organisieren sich die Unternehmen rund um ihre Daten neu, um einen "data driven" Ansatz zu verfolgen. Es ist eine Geschichte mit mehreren Wendungen, die letztendlich auf eine Lösung hinausläuft.

In diesem Artikel werden die verschiedenen Revolutionen im Bereich der Unternehmensdaten erörtert, die in den letzten Jahren unternommen wurden, um den Geschäftswert von Daten zu maximieren.

im Silo

In den 80er Jahren entwickelten sich die Informationssysteme immens. Es wurden Geschäftsanwendungen entwickelt, fortschrittliche Programmiersprachen kamen auf, und es entstanden relationale Datenbanken. All diese Anwendungen blieben auf den Plattformen ihrer Besitzer, isoliert vom Rest des IT-Ökosystems. 

Aus diesen historischen und technologischen Gründen wurden die internen Daten eines Unternehmens in verschiedenen Technologien und in heterogenen Formaten verteilt. Zusätzlich zu den organisatorischen Problemen spricht man dann von einem Stammeseffekt. Jede IT-Abteilung hat ihre eigenen Werkzeuge und verwaltet implizit ihre eigenen Daten für ihre eigenen Zwecke. Wir sind Zeugen einer Art Datenhortung innerhalb von Organisationen. Um diese Vorschläge zu untermauern, wird häufig auf das Conway'sche Gesetz verwiesen: "Jede Architektur spiegelt die Organisation wider, die sie geschaffen hat." Diese Organisation, Silos genannt, führt zu sehr komplexen komplexen und mühsamen Querverweis von Daten die aus zwei verschiedenen Systemen stammen.

Die Suche nach einer zentralisierten und umfassenden Sicht auf die Daten eines Unternehmens wird die Informationssysteme zu einer neuen Revolution führen.

Das Konzept eines Data Warehouse

Ende der 90er Jahre war die Business Intelligence in vollem Gange. Zu analytischen Zwecken und mit der Absicht, alle strategischen Fragen zu beantworten, entstand das Konzept des Data Warehouse. 

Dazu werden die Daten aus Großrechnern oder relationalen Datenbanken gewonnen und an einen ETL (Extract Transform Loader) übertragen. In ein so genanntes Pivot-Format projiziert, können Analysten und Entscheidungsträger auf die gesammelten und formatierten Daten zugreifen, um vorher festgelegte Fragen und spezifische Fälle von Überlegungen zu beantworten. Aus der Frage ergibt sich ein Datenmodell.

Diese Revolution ist immer mit einigen Problemen verbunden. Die Verwendung von ETL-Tools ist mit gewissen Kosten verbunden, ganz zu schweigen von der damit verbundenen Hardware. Die Zeit, die zwischen der Formalisierung des Bedarfs und dem Erhalt des Berichts vergeht, ist zeitaufwendig. Es ist eine Revolution, die teuer ist, wenn man die Effizienz verbessern will.

Die neue Revolution eines Daten-Lake

Das Aufkommen von Daten-Lakes kehrt die bisherigen Überlegungen um. Ein Daten-Lake ermöglicht es Organisationen, alle nützlichen Datenspeicher, unabhängig von ihrer Quelle oder ihrem Format, zu sehr geringen Kosten zu zentralisieren. . Wir lagern die Daten eines Unternehmens ein, ohne ihre Verwendung für einen zukünftigen use case vorauszusetzen. Wir selektieren diese Rohdaten nur für einen bestimmten Verwendungszweck und wandeln sie in strategische Informationen um.

Wir bewegen uns von einer "a priori" zu einer "a posteriori" Logik. Diese Revolution eines Daten-Lake konzentriert sich auf neue Fähigkeiten und Kenntnisse: Datenwissenschaftler und Dateningenieure sind in der Lage, die Behandlung von Daten zu starten, die Ergebnisse viel schneller als die Zeit mit Data Warehouses verbracht.

Ein weiterer Vorteil dieses gelobten Landes ist sein Preis. Data Lakes werden oft als Open-Source-Lösung angeboten und sind billig, auch die dazugehörige Hardware. Wir sprechen oft von Community-Hardware.

...oder besser gesagt, ein Daten-Sumpf

Bestimmte Vorteile sind mit dem Daten-Lake Revolution, aber sie bringen auch neue Herausforderungen mit sich. Das Fachwissen, das für die Einrichtung und Wartung dieser Data Lakes erforderlich ist, ist rar und daher für Unternehmen kostspielig. Darüber hinaus birgt die tagtägliche Ablage von Daten in einem Daten-Lake ohne effiziente Verwaltung oder Organisation das Risiko, dass die Infrastruktur unbrauchbar wird. Die Daten gehen dann unweigerlich in der Masse verloren.

Dieses Datenmanagement wird von neuen Fragen im Zusammenhang mit der Datenregulierung (GDPR, Cnil, etc.) und der Datensicherheit begleitet: bereits existierende Themen in der Data Warehouse Welt. Die richtigen Daten für die richtige Verwendung zu finden, ist noch nicht so einfach zu machen.

Die Abrechnung: Aufbau einer Data Governance

Die Internet-Giganten haben verstanden, dass die Zentralisierung dieser Daten ein erster, wenn auch unzureichender Schritt ist. Der letzte Baustein auf dem Weg zu einem "data driven" Ansatz ist der Aufbau einer data governance. Innovation durch Daten erfordert ein besseres Wissen über diese Daten. Wo sind meine Daten gespeichert? Wer nutzt sie? Welches Ziel wird damit verfolgt? Wie werden sie genutzt?

Um Datenexperten dabei zu helfen, den Lebenszyklus von Daten darzustellen und zu visualisieren, sind neue Tools aufgetaucht: Wir nennen sie "Datenkataloge". Sie befinden sich über den Dateninfrastrukturen und ermöglichen die Erstellung ein durchsuchbares Metadaten . Sie ermöglichen es, eine Geschäftsvision und Datentechniken zu erwerben, indem sie alle gesammelten Informationen zentralisieren. Genauso wie Google keine Webseiten speichert, sondern deren Metadaten , um sie zu referenzieren, müssen Unternehmen auch die Metadaten ihrer Daten speichern, um deren Nutzung und Auffindung zu erleichtern. Gartner bestätigt dies in seiner Studie "Datenkatalog ist das neue Schwarz": Wenn Ihr Daten-Lakeohne Metadaten und Governance ist, wird er als ineffizient angesehen.

Dank dieser neuen Werkzeuge werden die Daten zu einem Vorteil für alle Mitarbeiter. Die leicht zu bedienende Schnittstelle erfordert keine technischen Kenntnisse und wird zu einer einfachen Möglichkeit, diese Daten zu kennen, zu organisieren und zu verwalten . Der Datenkatalog wird zum Referenzwerkzeug für die Zusammenarbeit im Unternehmen.

Eine Rundumsicht auf diese Daten zu erlangen und eine data governance zu starten, um Ideen voranzutreiben, wird dadurch möglich.

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.