Zu vermeidende Fallen bei einem Datenkatalog - Technische Integration
Actian Germany GmbH
September 29, 2022

Die Verwaltung vonMetadaten ist ein wichtiger Bestandteil eines Datenmanagement und erfordert mehr als nur die Datenkatalog , so vernetzt sie auch sein mag.
Ein Datenkatalog reduziert natürlich den Workload , garantiert aber nicht per se den Erfolg des Projekts.
In dieser Artikelserie erfahren Sie, welche Fallstricke und vorgefassten Meinungen bei der Einführung eines unternehmensweiten Datenkatalog vermieden werden sollten. Die hier beschriebenen Fallen drehen sich um 4 zentrale Themen, die für den Erfolg der Initiative entscheidend sind:
- Datenkultur innerhalb der Organisation.
- Interne Projektträgerschaft.
- Projektleitung.
- Technische Integration des Datenkatalog.
Einbindung des Datenkatalog in das Unternehmens-Ökosystem bietet Möglichkeiten zur Wertschöpfung. Es ist wichtig, diese Aspekte zu berücksichtigen und die potenziellen Vorteile zu verstehen.
Nicht alle Metadaten müssen von Hand eingegeben werden
Immer mehr Systeme produzieren, aggregieren und ermöglichen die Eingabe von Metadaten für lokale Werte. Diese Informationen müssen aus offensichtlichen Gründen (Kostenersparnis, Zuverlässigkeit und Verfügbarkeit der Daten) abgerufen und im Katalog konsolidiert werden, ohne dass sie doppelt eingegeben werden.
Der Datenkatalog bietet daher die Möglichkeit, diese Informationen mit dem Wissen der Mitwirkenden in ihren jeweiligen Bereichen zu konsolidieren. Diese Konsolidierung muss jedoch durch eine technische Integration und nicht durch manuellen Aufwand erfolgen. Auch wenn es offensichtlich ist, dass es nicht effizient ist, dieselben Informationen zweimal einzugeben, noch ist die Durchführung von Importen/Exporten zwischen Systemen durch menschliche Handlungen der richtige Weg.
Die Stärke eines Datenkatalog bleibt seine Fähigkeit, Metadaten über technische Integrationsketten aufzunehmen und damit eine robuste Synchronisation zwischen Systemen zu gewährleisten.
Der Datenkatalog ist kein "automatisches" Werkzeug
Auf der anderen Seite wäre es irreführend zu glauben, dass ein Datenkatalog alle Arten von Metadaten unabhängig von ihrer Quelle oder ihrem Format extrahieren kann.
Der Katalog soll natürlich das Abrufen von Metadaten erleichtern, aber einige Metadaten werden nicht automatisch abrufbar sein. Es werden also immer Kosten entstehen, die mit dem Einsatz der Mitwirkenden verbunden sind.
Der erste Grund dafür liegt in der Herkunft mancher Metadaten: Manche Informationen können in den Systemen einfach nicht vorhanden sein, weil sie nur aus dem Wissen von Experten stammen. Der Datenkatalog ist daher in diesem Fall ein potenzieller Kandidat, um das Master-System zu werden und diese Informationen zu erhalten.
Umgekehrt kann es vorkommen, dass Informationen in einem System vorhanden sind, die aus verschiedenen Gründen nicht automatisch abgerufen werden können. Es könnte zum Beispiel das Fehlen einer
eine Schnittstelle, die einen stabilen Zugriff auf die Informationen ermöglicht. Das Risiko, dass die Informationen verrauscht werden, ist daher groß und kann zu einer Verschlechterung der Qualität des Kataloginhalts führen und die Benutzer letztendlich von der Nutzung abhalten.
Der Datenkatalog darf nicht mit einer eindeutigen Metadaten verknüpft sein
Metadaten stammen aus vielen verschiedenen Ebenen. Folglich gibt es mehrere, sich ergänzende Quellen, die für ein globales Verständnis erforderlich sind. Gerade die Zusammenführung dieser Informationen in einer zentralen Lösung, einem Datenkatalog, wird den Nutzern die notwendigen Elemente zur Verfügung stellen.
Die Entscheidung für einen verbundene Daten ist ein echter Gewinn, da die Asset Discovery und die damit verbundene Metadaten durch die Automatisierung erheblich erleichtert wird.
Diese Konnektivität kann sich auch auf andere ergänzende Systeme erstrecken. Diese Systeme können dem ersten System vorausgehen oder nachfolgen und ermöglichen, falls erforderlich, die Materialisierung der Abstammung und somit die Dokumentation der Ströme und Transformationen zwischen den Systemen.
Die Systeme können auch unabhängig voneinander sein und ermöglichen durch ihre Aufnahme in den Katalog eine umfassende Kartographie des Unternehmensbestandes.
Schließlich können angesichts der Vielfalt der Arten von Vermögenswerten, die im Katalog dokumentiert werden können, auch die verschiedenen verbundenen Quellen zur Anreicherung eines bestimmten Universums im Datenkatalog beitragen: semantische Ebenen für einige, physische Ebenen für andere usw.
Die verschiedenen Quellen, aus denen der Datenkatalog gespeist wird, werden nach einer Strategie, die auf die Schaffung von Werten abzielt, unter der globalen Aufsicht des Datenbüros schrittweise integriert, wobei stets ein iterativer Ansatz verfolgt wird.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.