Zu vermeidende Fallen bei einem Datenkatalog - Technische Integration
Zusammenfassung
- Ein Datenkatalog technisch in das Unternehmensökosystem integriert werden, um Metadaten zu konsolidieren und doppelten manuellen Aufwand zu vermeiden.
- Nicht alle Metadaten automatisch erfasst werden, sodass weiterhin Beiträge von Mitwirkenden erforderlich sind, um Fachwissen einzubringen und fehlende Systeminformationen zu ergänzen.
- Ein Datenkatalog leistungsstark, aber er ist kein „Wundermittel“ und kann nicht automatisch jede Art von Metadaten jeder Quelle abrufen.
- Es sollte mit mehreren sich ergänzenden Metadaten verbunden sein, anstatt sich auf ein einziges System zu verlassen.
- Diese Integrationen sollten schrittweise eingeführt werden, wobei der Schwerpunkt auf einer iterativen Strategie liegt, die auf die Schaffung von Mehrwert ausgerichtet ist.
Metadaten ist ein wichtiger Bestandteil in einem Datenmanagement und erfordert mehr als nur den Datenkatalog Lösung, so vernetzt sie auch sein mag.
Ein Datenkatalog reduziert natürlich den Workload , garantiert aber nicht per se den Erfolg des Projekts.
In dieser Artikelserie erfahren Sie, welche Fallstricke und vorgefassten Meinungen bei der Einführung eines unternehmensweiten Datenkatalog vermieden werden sollten. Die hier beschriebenen Fallen drehen sich um 4 zentrale Themen, die für den Erfolg der Initiative entscheidend sind:
- Datenkultur innerhalb der Organisation.
- Interne Projektträgerschaft.
- Projektleitung.
- Technische Integration des Datenkatalog.
Einbindung des Datenkatalog in das Unternehmens-Ökosystem bietet Möglichkeiten zur Wertschöpfung. Es ist wichtig, diese Aspekte zu berücksichtigen und die potenziellen Vorteile zu verstehen.
Nicht alle Metadaten müssen von Hand eingegeben werden
Immer mehr Systeme erzeugen, bündeln und ermöglichen die Erfassung von Metadaten lokale Zwecke. Diese Informationen müssen im Katalog abgerufen und konsolidiert werden, ohne dass sie aus naheliegenden Gründen (Kosteneinsparungen, Datenzuverlässigkeit und Verfügbarkeit) doppelt eingegeben werden müssen.
Der Datenkatalog bietet daher die Möglichkeit, diese Informationen mit dem Wissen der Mitwirkenden in ihren jeweiligen Bereichen zu konsolidieren. Diese Konsolidierung muss jedoch durch eine technische Integration und nicht durch manuellen Aufwand erfolgen. Auch wenn es offensichtlich ist, dass es nicht effizient ist, dieselben Informationen zweimal einzugeben, noch ist die Durchführung von Importen/Exporten zwischen Systemen durch menschliche Handlungen der richtige Weg.
Die Stärke eines Datenkatalog bleibt seine Fähigkeit, Metadaten über technische Integrationsketten aufzunehmen und damit eine robuste Synchronisation zwischen Systemen zu gewährleisten.
Der Datenkatalog ist kein "automatisches" Werkzeug
Auf der anderen Seite wäre es irreführend zu glauben, dass ein Datenkatalog alle Arten von Metadaten unabhängig von ihrer Quelle oder ihrem Format extrahieren kann.
Der Katalog soll natürlich das Abrufen von Metadaten erleichtern, aber einige Metadaten werden nicht automatisch abrufbar sein. Es werden also immer Kosten entstehen, die mit dem Einsatz der Mitwirkenden verbunden sind.
Der erste Grund dafür liegt in der Herkunft mancher Metadaten: Manche Informationen können in den Systemen einfach nicht vorhanden sein, weil sie nur aus dem Wissen von Experten stammen. Der Datenkatalog ist daher in diesem Fall ein potenzieller Kandidat, um das Master-System zu werden und diese Informationen zu erhalten.
Umgekehrt können bestimmte Informationen in einem System vorhanden sein, aber aus vielen Gründen nicht automatisiert abgerufen werden können. Beispielsweise könnte es keine Schnittstelle geben, die einen stabilen Zugriff auf Informationen ermöglicht (
).
Das Risiko, dass es zu Störungen im Zusammenhang mit den Informationen kommt, ist daher hoch und kann zu einer Verschlechterung der Qualität des Kataloginhalts führen und letztendlich die Nutzer davon abhalten, ihn zu verwenden.
Der Datenkatalog darf nicht mit einer eindeutigen Metadaten verknüpft sein
Metadaten stammen aus vielen verschiedenen Ebenen. Folglich gibt es mehrere, sich ergänzende Quellen, die für ein globales Verständnis erforderlich sind. Gerade die Zusammenführung dieser Informationen in einer zentralen Lösung, einem Datenkatalog, wird den Nutzern die notwendigen Elemente zur Verfügung stellen.
Die Entscheidung für einen verbundene Daten ist ein echter Gewinn, da die Asset Discovery und die damit verbundene Metadaten durch die Automatisierung erheblich erleichtert wird.
Diese Konnektivität kann sich auch auf andere ergänzende Systeme erstrecken. Diese Systeme können dem ersten System vorausgehen oder nachfolgen und ermöglichen, falls erforderlich, die Materialisierung der Abstammung und somit die Dokumentation der Ströme und Transformationen zwischen den Systemen.
Die Systeme können auch unabhängig voneinander sein und ermöglichen durch ihre Aufnahme in den Katalog eine umfassende Kartographie des Unternehmensbestandes.
Schließlich können angesichts der Vielfalt der Arten von Objekten, die im Katalog dokumentiert werden können, die verschiedenen verknüpften Quellen auch zur Anreicherung eines bestimmten Universums im Datenkatalog beitragen: semantische Ebenen für die einen, physische Ebenen für die anderen usw.
Die verschiedenen Quellen, aus denen der Datenkatalog gespeist wird, werden nach einer Strategie, die auf die Schaffung von Werten abzielt, unter der globalen Aufsicht des Datenbüros schrittweise integriert, wobei stets ein iterativer Ansatz verfolgt wird.