Blog | Datenanalyse | | 5 Lesezeit

7 Lügen von Datenkatalog #1: Keine Data Governance-Lösung

ein Datenkatalog ist keine Governance-Lösung

Zusammenfassung

  • Ein Datenkatalog keine vollständige Data Governance ; Governance ist eine umfassendere organisatorische Transformation, die Rollen, Richtlinien und Prozesse umfasst.
  • Manche Anbieter machen zu große Versprechungen, indem sie Datenkataloge als Komplettlösungen für Qualität, Compliance und Governance anpreisen.
  • Die Hauptaufgabe eines Datenkatalog darin, den Nutzern dabei zu helfen, Daten mithilfe von Metadaten zu finden, zu verstehen und zu nutzen.
  • Wenn man einen Datenkatalog zu vielen Aufgaben überfrachtet, führt dies zu komplexen, unflexiblen und ineffektiven Lösungen.
  • Am besten ist es, solide Governance-Praktiken mit einem zielgerichteten, benutzerfreundlichen Datenkatalog zu kombinieren.

Der Datenkatalog Markt hat sich rasant entwickelt und gilt heute als unverzichtbar für die Umsetzung einer data-driven Strategie. Dieser Markt ist Opfer seines eigenen Erfolgs geworden und hat eine Reihe von Akteuren aus angrenzenden Märkten angezogen.

 Diese Akteure haben ihre Marketingpositionierung geändert und präsentieren sich nun als Datenkatalog .

Die Realität sieht so aus, dass diese Unternehmen zwar relativ wenig über die eigentlichen Datenkatalog wissen, aber mit einem ihrem Marketingbudget entsprechenden Erfolg versuchen, die Kunden davon zu überzeugen, dass es sich bei einem Datenkatalog nicht nur um ein High-Performance für Datenteams handelt, sondern um eine integrierte Lösung, die eine ganze Reihe anderer Themen abdeckt.

Das Ziel dieser Blogserie ist es, das Angebot dieser Anbieter von Datenkatalog in letzter Minute zu dekonstruieren.

Ein Datenkatalog ist keine Data Governance-Lösung

Dies ist wahrscheinlich unsere umstrittenste Position zur Rolle eines Datenkatalog und die Kontroverse hat ihren Ursprung in den kraftvollen Marketingbotschaften des Weltmarktführers im Metadaten , dessen Lösung in Wirklichkeit eine Data Governance Plattform ist, die als Datenkatalog verkauft wird.

Natürlich ist eine solide Data Governance einer der Grundpfeiler einer effektiven Datenstrategie. Governance hat jedoch wenig mit Tooling zu tun.

Ihr Hauptzweck ist die Definition von Rollen, Verantwortlichkeiten, Unternehmensrichtlinien, Verfahren, Kontrollen und Ausschüssen. Kurz gesagt, seine Funktion besteht darin, die interne Datenkontrolle in all ihren Dimensionen zu implementieren und zu orchestrieren.

Wir sollten uns darüber im Klaren sein, dass Data Governance viele verschiedene Aspekte umfasst (Verarbeitungs- und Speicherarchitektur, Klassifizierung, Aufbewahrung, Qualität, Risiko, Konformität, Innovation usw.) und dass es kein universelles "Einheitsmodell" gibt, das für alle Organisationen geeignet ist. Wie in anderen Governance-Bereichen muss jede Organisation ihre eigene Landschaft auf der Grundlage ihrer Kapazitäten und Ambitionen sowie einer gründlichen Risikoanalyse konzipieren und steuern.

Die Einführung einer effektiven Data Governance ist kein Projekt, sondern vielmehr ein Transformationsprogramm.

Keine kommerzielle "Lösung" kann diese Umstellungsbemühungen ersetzen.

Wie passt der Datenkatalog zu all dem?

Die Suche nach einem Datenkatalog ist in der Regel das Ergebnis einer sehr operativen Anforderung: Sind der Daten-Lake und eine Reihe von Self-Service erst einmal eingerichtet, stellt sich schnell die Frage, was der Daten-Lake eigentlich enthält (sowohl aus technischer als auch aus semantischer Sicht), woher die Daten stammen, welche Transformationen die Daten möglicherweise erfahren haben, wer für die Daten zuständig ist, welche internen Richtlinien für die Daten gelten, wer die Daten derzeit nutzt und warum usw.

Die Unfähigkeit, dem Nutzer diese Art von Informationen zur Verfügung zu stellen, kann schwerwiegende Folgen für eine Organisation haben, und ein Datenkatalog ist das beste Mittel, um dieses Risiko zu mindern. Bei der Auswahl einer bereichsübergreifenden Lösung, an der Personen aus vielen verschiedenen Abteilungen beteiligt sind, wird die Auswahl der Lösung oft den Verantwortlichen für Data Governance überlassen, da sie am besten in der Lage zu sein scheinen, die Erwartungen der meisten Beteiligten zu koordinieren.

Hier beginnt die Alchemie. Der Datenkatalog, dessen ursprünglicher Zweck darin bestand, Datenteams eine schnelle Lösung zum Auffinden, Erkunden, Verstehen und Nutzen der Daten zu bieten, hat sich zu einem gigantischen Projekt entwickelt, bei dem alle Aspekte der Governance geklärt werden müssen.

Von dem Projekt wird erwartet, dass es:

  • Datenqualität verwalten .
  • verwalten personenbezogener Daten und die Einhaltung von Vorschriften (vor allem GDPR).
  • Vertraulichkeit, Sicherheit und Datenzugang verwalten .
  • Vorschlag für ein neues Datenmanagement (MDM).
  • Stellen Sie für alle Datensätze eine automatisierte Herkunftsverfolgung auf Feldebene sicher.
  • Alle im Governance-System definierten Rollen unterstützen und die entsprechende Workflow-Konfiguration ermöglichen.
  • Integration aller Geschäftsmodelle, die in den letzten 10 Jahren für das Urbanisierungsprogramm entwickelt wurden.
  • Ermöglichen Sie abfrageübergreifende Abfragen auf die Datenquellen unter Einhaltung der Nutzer für eben diese Quellen sowie unter Anonymisierung der Ergebnisse.

Manche Anbieter verwalten ihre Kunden verwalten überzeugen, dass ihre Lösung eine einzigartige Komplettlösung für Data Governance darstellt. Wenn Sie glauben, dass dies möglich ist, wenden Sie sich ruhig an sie; sie werden Ihnen gerne weiterhelfen. Aber um ehrlich zu sein: Wir glauben einfach nicht, dass eine solche Plattform möglich oder gar wünschenswert ist. Zu komplex, zu starr, zu teuer und zu bürokratisch – eine solche Lösung lässt sich niemals an ein datenzentriertes Unternehmen anpassen.

Für uns spielt der Datenkatalog eine Schlüsselrolle in einem Data Governance Programm. Diese Rolle sollte nicht darin bestehen, alle Aspekte der Governance zu unterstützen, sondern vielmehr dazu genutzt werden, die Kommunikation und das Bewusstsein für Governance-Regeln innerhalb des Unternehmens zu erleichtern und jedem Stakeholder zu helfen, ein aktiver Teil dieser Governance zu werden.

Unserer Meinung nach ist ein Datenkatalog eine der Komponenten, die in datenzentrierten Organisationen, die auf Data Lakes mit modernen Datenpipelines setzen, den größten Return on Investment liefert... vorausgesetzt, er lässt sich schnell implementieren und ist mit einem angemessenen Preis verbunden.

Mitnehmen

Ein Datenkatalog ist keine Data Governance Management Plattform.

Data Governance im Wesentlichen ein vielschichtiges Transformationsprogramm, das sich nicht mit einer einzigen Lösung bewältigen lässt. In einem datenzentrierten Unternehmen besteht der beste Weg, um anzufangen, zu lernen, sich weiterzubilden und agil zu bleiben, darin, klare Governance-Richtlinien mit einem modernen Datenkatalog zu verbinden, Datenkatalog diese Richtlinien an die Endnutzer weitergegeben werden können.