Daten-Intelligenz

7 Lügen von Datenkatalog #1: Keine Data Governance Lösung

Actian Germany GmbH

Juni 16, 2021

ein Datenkatalog ist keine Governance-Lösung

Der Markt für Datenkatalog hat sich rasch entwickelt und gilt heute als unverzichtbar für die Umsetzung einer data driven Strategie. Dieser Markt ist Opfer seines eigenen Erfolgs geworden und hat eine Reihe von Akteuren aus angrenzenden Märkten angezogen.

 Diese Akteure haben ihre Marketingpositionierung geändert und präsentieren sich nun als Datenkatalog .

Die Realität sieht so aus, dass diese Unternehmen zwar relativ wenig über die eigentlichen Datenkatalog wissen, aber mit einem ihrem Marketingbudget entsprechenden Erfolg versuchen, die Kunden davon zu überzeugen, dass es sich bei einem Datenkatalog nicht nur um ein High-Performance für Datenteams handelt, sondern um eine integrierte Lösung, die eine ganze Reihe anderer Themen abdeckt.

Das Ziel dieser Blogserie ist es, das Angebot dieser Anbieter von Datenkatalog in letzter Minute zu dekonstruieren.

Ein Datenkatalog ist keine Data Governance Lösung

Dies ist wahrscheinlich unsere umstrittenste Position zur Rolle eines Datenkatalog und die Kontroverse hat ihren Ursprung in den kraftvollen Marketingbotschaften des Weltmarktführers im Metadaten , dessen Lösung in Wirklichkeit eine data governance ist, die als Datenkatalog verkauft wird.

Eine solide data governance ist eine der Säulen einer wirksamen Datenstrategie. Governance hat jedoch wenig mit Tooling zu tun.

Ihr Hauptzweck ist die Definition von Rollen, Verantwortlichkeiten, Unternehmensrichtlinien, Verfahren, Kontrollen und Ausschüssen. Kurz gesagt, seine Funktion besteht darin, die interne Datenkontrolle in all ihren Dimensionen zu implementieren und zu orchestrieren.

Wir sollten uns darüber im Klaren sein, dass data governance viele verschiedene Aspekte umfasst (Verarbeitungs- und Speicherarchitektur, Klassifizierung, Aufbewahrung, Qualität, Risiko, Konformität, Innovation usw.) und dass es kein universelles Modell gibt, das für alle Organisationen geeignet ist. Wie in anderen Governance-Bereichen muss jede Organisation ihre eigene Landschaft auf der Grundlage ihrer Kapazitäten und Ambitionen sowie einer gründlichen Risikoanalyse konzipieren und steuern.

Die Einführung einer effektiven data governance ist kein Projekt, sondern ein Transformationsprogramm.

Keine kommerzielle "Lösung" kann diese Umstellungsbemühungen ersetzen.

Wie passt der Datenkatalog zu all dem?

Die Suche nach einem Datenkatalog ist in der Regel das Ergebnis einer sehr operativen Anforderung: Sind der Daten-Lake und eine Reihe von Self-Service erst einmal eingerichtet, stellt sich schnell die Frage, was der Daten-Lake eigentlich enthält (sowohl aus technischer als auch aus semantischer Sicht), woher die Daten stammen, welche Transformationen die Daten möglicherweise erfahren haben, wer für die Daten zuständig ist, welche internen Richtlinien für die Daten gelten, wer die Daten derzeit nutzt und warum usw.

Die Unfähigkeit, dem Nutzer diese Art von Informationen zur Verfügung zu stellen, kann schwerwiegende Folgen für eine Organisation haben, und ein Datenkatalog ist das beste Mittel, um dieses Risiko zu mindern. Bei der Auswahl einer bereichsübergreifenden Lösung, an der Personen aus vielen verschiedenen Abteilungen beteiligt sind, wird die Auswahl der Lösung häufig den für die data governance Verantwortlichen übertragen, da diese am besten in der Lage zu sein scheinen, die Erwartungen der meisten Beteiligten zu koordinieren.

An dieser Stelle beginnt die Alchemie. Der Datenkatalog, dessen ursprünglicher Zweck es war, den Datenteams eine schnelle Lösung zum Entdecken, kennenlernen, Verstehen und Nutzen der Daten zu bieten, wird zu einem gigantischen Projekt, bei dem alle Aspekte der Governance gelöst werden müssen.

Von dem Projekt wird erwartet, dass es:

  • Datenqualität verwalten .
  • verwalten personenbezogener Daten und die Einhaltung von Vorschriften (vor allem GDPR).
  • Vertraulichkeit, Sicherheit und Datenzugang verwalten .
  • Vorschlag für ein neues Datenmanagement (MDM).
  • Sicherstellung einer feldweisen automatisierten Abfolge für alle Datensätze.
  • Alle im Governance-System definierten Rollen unterstützen und die entsprechende Workflow-Konfiguration ermöglichen.
  • Integration aller Geschäftsmodelle, die in den letzten 10 Jahren für das Urbanisierungsprogramm entwickelt wurden.
  • Erlauben Sie gekreuzte Abfragen auf die Datenquellen unter Einhaltung der Nutzer auf dieselben Quellen sowie die Anonymisierung der Ergebnisse.

Es gibt Anbieter, verwalten ihre Kunden davon überzeugen wollen, dass ihre Lösung die einzige Anlaufstelle für data governance sein kann. Wenn Sie glauben, dass dies möglich ist, rufen Sie sie einfach an, sie werden Ihnen gerne helfen. Aber um ehrlich zu sein, glauben wir bei Zeenea einfach nicht, dass eine solche Plattform möglich oder sogar wünschenswert ist. Zu komplex, zu starr, zu teuer und zu bürokratisch, diese Art von Lösung kann niemals an eine datenzentrierte Organisation angepasst werden.

Für uns spielt der Datenkatalog eine Schlüsselrolle in einem data governance . Diese Rolle sollte nicht darin bestehen, alle Aspekte der Governance zu unterstützen, sondern vielmehr dazu genutzt werden, die Kommunikation und das Bewusstsein für Governance-Regeln innerhalb des Unternehmens zu erleichtern und jedem Stakeholder zu helfen, ein aktiver Teil dieser Governance zu werden.

Unserer Meinung nach ist ein Datenkatalog eine der Komponenten, die in datenzentrierten Organisationen, die auf Data Lakes mit modernen Datenpipelines setzen, den größten Return on Investment liefert... vorausgesetzt, er lässt sich schnell implementieren und ist mit einem angemessenen Preis verbunden.

Mitnehmen

Ein Datenkatalog ist keine data governance .

Data governance ist im Wesentlichen ein Transformationsprogramm mit mehreren Ebenen, die nicht von einer einzigen Lösung abgedeckt werden können. In einer datenzentrierten Organisation ist der beste Weg, um zu beginnen, zu lernen, zu schulen und agil zu bleiben, eine Mischung aus klaren Governance-Richtlinien und einem modernen Datenkatalog , der diese Richtlinien mit den Endbenutzern teilen kann.

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.