7 Lügen von Datenkatalog #1: Keine Data Governance Lösung
Actian Germany GmbH
Juni 16, 2021

Der Markt für Datenkatalog hat sich rasch entwickelt und gilt heute als unverzichtbar für die Umsetzung einer data driven Strategie. Dieser Markt ist Opfer seines eigenen Erfolgs geworden und hat eine Reihe von Akteuren aus angrenzenden Märkten angezogen.
Diese Akteure haben ihre Marketingpositionierung geändert und präsentieren sich nun als Datenkatalog .
Die Realität sieht so aus, dass diese Unternehmen zwar relativ wenig über die eigentlichen Datenkatalog wissen, aber mit einem ihrem Marketingbudget entsprechenden Erfolg versuchen, die Kunden davon zu überzeugen, dass es sich bei einem Datenkatalog nicht nur um ein High-Performance für Datenteams handelt, sondern um eine integrierte Lösung, die eine ganze Reihe anderer Themen abdeckt.
Das Ziel dieser Blogserie ist es, das Angebot dieser Anbieter von Datenkatalog in letzter Minute zu dekonstruieren.
Hier sind, unserer Meinung nach, die 7 Lügen der Datenkatalog :
- Ein Datenkatalog ist eine Data Governance Plattform.
- Ein Datenkatalog kann Datenqualität messen und verwalten .
- Ein Datenkatalog kann die Einhaltung von Vorschriften verwalten .
- Ein Datenkatalog kann Daten direkt Anfrage .
- Ein Datenkatalog kann logische Architekturen und Geschäftsprozesse rund um Daten modellieren.
- Ein Datenkatalog ist ein kollaboratives Kartographie- und Metadaten , das nicht automatisiert werden kann.
- Ein Datenkatalog ist ein langes, komplexes und teures Projekt.
Ein Datenkatalog ist keine Data Governance Lösung
Dies ist wahrscheinlich unsere umstrittenste Position zur Rolle eines Datenkatalog und die Kontroverse hat ihren Ursprung in den kraftvollen Marketingbotschaften des Weltmarktführers im Metadaten , dessen Lösung in Wirklichkeit eine data governance ist, die als Datenkatalog verkauft wird.
Eine solide data governance ist eine der Säulen einer wirksamen Datenstrategie. Governance hat jedoch wenig mit Tooling zu tun.
Ihr Hauptzweck ist die Definition von Rollen, Verantwortlichkeiten, Unternehmensrichtlinien, Verfahren, Kontrollen und Ausschüssen. Kurz gesagt, seine Funktion besteht darin, die interne Datenkontrolle in all ihren Dimensionen zu implementieren und zu orchestrieren.
Wir sollten uns darüber im Klaren sein, dass data governance viele verschiedene Aspekte umfasst (Verarbeitungs- und Speicherarchitektur, Klassifizierung, Aufbewahrung, Qualität, Risiko, Konformität, Innovation usw.) und dass es kein universelles Modell gibt, das für alle Organisationen geeignet ist. Wie in anderen Governance-Bereichen muss jede Organisation ihre eigene Landschaft auf der Grundlage ihrer Kapazitäten und Ambitionen sowie einer gründlichen Risikoanalyse konzipieren und steuern.
Die Einführung einer effektiven data governance ist kein Projekt, sondern ein Transformationsprogramm.
Keine kommerzielle "Lösung" kann diese Umstellungsbemühungen ersetzen.
Wie passt der Datenkatalog zu all dem?
Die Suche nach einem Datenkatalog ist in der Regel das Ergebnis einer sehr operativen Anforderung: Sind der Daten-Lake und eine Reihe von Self-Service erst einmal eingerichtet, stellt sich schnell die Frage, was der Daten-Lake eigentlich enthält (sowohl aus technischer als auch aus semantischer Sicht), woher die Daten stammen, welche Transformationen die Daten möglicherweise erfahren haben, wer für die Daten zuständig ist, welche internen Richtlinien für die Daten gelten, wer die Daten derzeit nutzt und warum usw.
Die Unfähigkeit, dem Nutzer diese Art von Informationen zur Verfügung zu stellen, kann schwerwiegende Folgen für eine Organisation haben, und ein Datenkatalog ist das beste Mittel, um dieses Risiko zu mindern. Bei der Auswahl einer bereichsübergreifenden Lösung, an der Personen aus vielen verschiedenen Abteilungen beteiligt sind, wird die Auswahl der Lösung häufig den für die data governance Verantwortlichen übertragen, da diese am besten in der Lage zu sein scheinen, die Erwartungen der meisten Beteiligten zu koordinieren.
An dieser Stelle beginnt die Alchemie. Der Datenkatalog, dessen ursprünglicher Zweck es war, den Datenteams eine schnelle Lösung zum Entdecken, kennenlernen, Verstehen und Nutzen der Daten zu bieten, wird zu einem gigantischen Projekt, bei dem alle Aspekte der Governance gelöst werden müssen.
Von dem Projekt wird erwartet, dass es:
- Datenqualität verwalten .
- verwalten personenbezogener Daten und die Einhaltung von Vorschriften (vor allem GDPR).
- Vertraulichkeit, Sicherheit und Datenzugang verwalten .
- Vorschlag für ein neues Datenmanagement (MDM).
- Sicherstellung einer feldweisen automatisierten Abfolge für alle Datensätze.
- Alle im Governance-System definierten Rollen unterstützen und die entsprechende Workflow-Konfiguration ermöglichen.
- Integration aller Geschäftsmodelle, die in den letzten 10 Jahren für das Urbanisierungsprogramm entwickelt wurden.
- Erlauben Sie gekreuzte Abfragen auf die Datenquellen unter Einhaltung der Nutzer auf dieselben Quellen sowie die Anonymisierung der Ergebnisse.
Es gibt Anbieter, verwalten ihre Kunden davon überzeugen wollen, dass ihre Lösung die einzige Anlaufstelle für data governance sein kann. Wenn Sie glauben, dass dies möglich ist, rufen Sie sie einfach an, sie werden Ihnen gerne helfen. Aber um ehrlich zu sein, glauben wir bei Zeenea einfach nicht, dass eine solche Plattform möglich oder sogar wünschenswert ist. Zu komplex, zu starr, zu teuer und zu bürokratisch, diese Art von Lösung kann niemals an eine datenzentrierte Organisation angepasst werden.
Für uns spielt der Datenkatalog eine Schlüsselrolle in einem data governance . Diese Rolle sollte nicht darin bestehen, alle Aspekte der Governance zu unterstützen, sondern vielmehr dazu genutzt werden, die Kommunikation und das Bewusstsein für Governance-Regeln innerhalb des Unternehmens zu erleichtern und jedem Stakeholder zu helfen, ein aktiver Teil dieser Governance zu werden.
Unserer Meinung nach ist ein Datenkatalog eine der Komponenten, die in datenzentrierten Organisationen, die auf Data Lakes mit modernen Datenpipelines setzen, den größten Return on Investment liefert... vorausgesetzt, er lässt sich schnell implementieren und ist mit einem angemessenen Preis verbunden.
Mitnehmen
Ein Datenkatalog ist keine data governance .
Data governance ist im Wesentlichen ein Transformationsprogramm mit mehreren Ebenen, die nicht von einer einzigen Lösung abgedeckt werden können. In einer datenzentrierten Organisation ist der beste Weg, um zu beginnen, zu lernen, zu schulen und agil zu bleiben, eine Mischung aus klaren Governance-Richtlinien und einem modernen Datenkatalog , der diese Richtlinien mit den Endbenutzern teilen kann.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.