Daten-Intelligenz

Alles, was Sie über eine Data Fabric wissen müssen

Actian Germany GmbH

April 13, 2022

Data Fabric

Bereits 2019 hat Gartner das Konzept der Data Fabric als einen der wichtigsten technologischen Trends für 2022 identifiziert. Hinter diesem Schlagwort verbirgt sich ein wichtiges Ziel: den Wert Ihrer Daten zu maximieren und Ihre digitale Transformation zu beschleunigen. Wie das geht, erfahren Sie in diesem Leitfaden.

Ordnung in Ihre Daten zu bringen, das ist das Versprechen einer Data Fabric. Es handelt sich jedoch nicht nur um eine Lösung zur Organisation oder Strukturierung von Informationen. Eine Data Fabric ist ein Werkzeug, mit dem Sie Ihren Daten einen Wert verleihen können. Die von Unternehmen erzeugte Datenmenge wächst in der Tat exponentiell. Jede Sekunde gibt es mehr und mehr Daten zu verwerten, die es Unternehmen ermöglichen, effizienter zu arbeiten und besser mit ihrem Markt oder ihren Kunden feinabstimmen . Die Zahlen sprechen für sich: IDC schätzt, dass das weltweit generierte Datenvolumen bis 2025 175 Zettabyte erreichen wird. Ein Volumen, das so groß ist, dass es, wenn es auf Blu-ray gespeichert würde, einem Stapel von Discs entspräche, der 23 Mal die Entfernung von der Erde zum Mond misst.

Was ist Data Fabric?

Gartner definiert Data Fabric als "ein Designkonzept, das als integrierte Schicht von Daten und Verbindungsprozessen fungiert". Mit anderen Worten, eine Data Fabric analysiert kontinuierlich Kombinationen aus vorhandenen, zugänglichen und abgeleiteten Metadaten , um intelligentere Informationen bereitzustellen und Datenmanagement effizienter zu unterstützen. Eine Data Fabric nutzt dann all diese Metadaten , um neue Prozesse zu entwerfen und einen standardisierten Zugang zu Daten für alle Geschäftsprofile innerhalb des Unternehmens zu etablieren: Anwendungsentwickler, Analysten, Datenwissenschaftler, etc.

Eine Data Fabric ist daher eine Reihe von Prozessen, die Daten lesen, erfassen, integrieren und bereitstellen, basierend auf dem Verständnis, wer die Daten nutzt, der Klassifizierung der Nutzungsarten und der Überwachung von Änderungen der Datennutzungsmuster.

Die Vorteile einer Data Fabric für Unternehmen

Gartner erklärt, dass der Deployment von Data Fabrics in Unternehmen bis 2024 die Effizienz der Datennutzung vervierfachen und gleichzeitig die von Menschen durchgeführten Datenmanagement um die Hälfte reduzieren wird. In diesem Sinne identifiziert das Institut drei Hauptbereiche von Möglichkeiten, die eine Data Fabric mit sich bringt:

  1. Eine 70%ige Reduzierung von Daten-Discovery, Analyse und Integration Aufgaben für Datenteams;
  2. Die Zunahme der Zahl der Datennutzerdurch die Wiederverwendung von Daten für eine größere Anzahl von Anwendungsfällen;
  3. Die Fähigkeit, mehr aus mehr Daten herauszuholen indem die Einführung und Nutzung von Sekundärdaten und Daten Dritter erheblich beschleunigt wird.

Vom technologischen Standpunkt aus betrachtet, passt sich eine Data Fabric passt sich an die in einer Organisation bereits vorhandenen Tools an. Sie kann aus bestehenden Integrations- und Qualitätstools, Datenmanagement und Governance-Plattformen (wie z. B. einem Datalog - wir werden darauf zurückkommen) entwickelt werden. In diesem Sinne ist das Designmodell ideal, da es Ihre vorhandene Technologie nutzt und gleichzeitig eine strategische Veränderung Ihres gesamten Datenmanagement anstrebt.

Schließlich hilft eine Data Fabric Unternehmen, Datensilos aufzubrechen. Sie können dann die Kosten und den Aufwand ihrer Datenteams reduzieren, die ständig Datenmanagement mit neuen Silos zusammenführen, umgestalten und neu einsetzen müssen.

Der Beitrag eines Datenkatalog zu einer Data Fabric

Wenn wir den Begriff Begriff der "integrierten Schicht" aus der Definition einer Data Fabric sowie das von Gartner vorgeschlagene Diagramm (siehe unten) als Richtschnur nehmen, stellen wir fest, dass ein Datenkatalog eine grundlegende Rolle beim Aufbau einer Data Fabric spielt. In der Tat beeinflusst er die höheren Schichten, die eine effiziente Data Fabric bilden.

Ebene 1 - Zugang zu allen Arten von Metadaten

Ein Datenkatalog ist das Fundament einer Data Fabric Struktur - er ist die erste (graue) Schicht. Er unterstützt die Identifikation, Sammlung und Analyse aller Datenquellen und aller Arten von Metadaten. Der Datenkatalog ist ein Ausgangspunkt für eine Data Fabric.

Schicht 2 - Metadaten Enablement und der Knowledge Graph

In der zweiten Schicht einer Data Fabric (gelb), konzentriert sich Garner auf Metadaten . Diese Aktivierung beinhaltet die kontinuierliche Analyse von Metadaten zur Berechnung von Schlüsselindikatoren. Diese Analyse wird durch den Einsatz von künstlicher Intelligenz (KI), Maschinelles Lernen (ML) und automatisierter Datenintegration erleichtert.

Die entdeckten Muster und Verbindungen werden dann in den Datenkatalog und andere Datenmanagement zurückgeführt, um Empfehlungen für die am Datenmanagement und der Integration beteiligten Personen und Maschinen zu geben. Dies erfordert eine kontinuierliche Analyse auf der Grundlage eines vernetzten Wissensgraphen - ein Mittel zur Erstellung und Visualisierung bestehender Beziehungen zwischen Datenbeständen unterschiedlicher Art, um sie geschäftlich nutzbar zu machen und diese Beziehungen für alle Benutzer im Unternehmen leicht auffindbar und navigierbar zu machen.

Schicht 3 - Dynamische Datenintegration

Die dritte Schicht (blau) von Gartner befasst sich in erster Linie mit den technischen Nutzern von Daten in Unternehmen. Diese Schicht der Data Fabric bezieht sich auf den Bedarf an Daten aufzubereiten, zu integrieren, kennenlernen und zu transformieren. Die Herausforderung besteht hier darin, Datenbestände aus einer Vielzahl von Werkzeugen für eine große Anzahl von Geschäftsanwendern zugänglich zu machen. Die Schlüsselwörter sind hier Flexibilität und Kompatibilität, um Datensilos aufzubrechen, mit den folgenden Merkmalen:

    • Ein System zur Verwaltung von Datenberechtigungen: Die Data Fabric muss den Zugriff durch den Nutzer automatisieren.
    • Automatisierte Bereitstellung: Jeder im Unternehmen sollte in der Lage sein, Zugang zu einem Datensatz aus der Data Fabric zu beantragen - über die Erstellung von Tickets mit integrierten data governance Funktionen.
    • Ein Werkzeug zur Datenexploration: Die Data Fabric soll es Nutzern ermöglichen, Daten (nicht nur Metadaten) kennenlernen , ohne die Fabric verlassen zu müssen.

Automatisierte Orchestrierung - wie im oberen Teil dieser dritten Schicht des Diagramms beschrieben - bezieht sich auf DataOps. Dabei handelt es sich um eine kollaborative Datenmanagement , die darauf abzielt, die Kommunikation, Integration und Automatisierung von Datenflüssen zwischen Datenmanagern und Datenkonsumenten innerhalb einer Organisation zu verbessern. Sie können mehr darüber in diesem Artikel lesen.

Gibt es ein einziges Tool für die Implementierung einer Data Fabric?

Gartner weist darauf hin, dass es kein einziges Tool gibt, das alle Schichten der Struktur umfassend unterstützt. In diesem Sinne, ist kein einzelner Anbieter in der Lage, eine Datenstruktur anzubieten, die mit einer vollständigen Data Fabric gleichgesetzt werden kann. Die Lösung liegt in der Interaktion zwischen den verschiedenen Schichten. Eine offene Plattform ist der Schlüssel, und Unternehmen müssen sich mit den besten, miteinander verbundenen Datenwerkzeugen ausstatten, um eine Data Fabric zu erreichen, die ihren Namen verdient. Der Aufbau einer Data Fabric sollte als Marathon, nicht als Sprint, betrachtet und in Etappen angegangen werden - der Datenkatalog ist die erste.

Aufbau einer Data Fabric mit Zeenea

Bei Zeenea haben die Unternehmen, die sich für unseren Smart Datenkatalog entschieden haben, bereits den Grundstein für ihre Data Fabric gelegt. Denn neben der Identifikation, Sammlung und Analyse aller Datenquellen sowie aller Arten von Metadaten (erste Schicht) bietet Zeenea über seinen Kern - über einen Wissensgraphen (zweite Schicht) - alle notwendigen Funktionen zur Aktivierung von Metadaten . Schließlich adressiert unser Katalog die dritte Ebene: zum einen über die Integration von data governance Regeln, zum anderen über die Zeenea Explorer Anwendung, die als echter Datenmarktplatz fungiert, so dass jeder Business Nutzer einfach auf die für ihn interessanten Schlüsseldaten zugreifen kann und so schnell einen Mehrwert aus den verfügbaren Daten schafft.

Wenn Sie mehr über unseren Smart Datenkatalog erfahren möchten, konsultieren Sie bitte die beiden folgenden eBooks oder kontaktieren Sie uns:

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.