Zusammenfassung

  • Datenkataloge bündeln Metadaten Daten auffindbar, verständlich und vertrauenswürdig zu machen.
  • Ermöglichen Sie Daten-Discovery schnellere Daten-Discovery, steigern Sie die Produktivität und verkürzen Sie die Vorbereitungszeit.
  • Unterstützen Sie die Demokratisierung von Daten, indem Sie diese für technische und geschäftliche Anwender zugänglich machen.
  • Zu den wichtigsten Funktionen gehören die Suche, die Abstammungsübersicht, der Wissensgraph und Geschäftsglossar.
  • Fördern Sie Governance, Compliance, Zusammenarbeit und data-driven Entscheidungsfindung.

Es ist kein Geheimnis, dass es für die enormen Informationsmengen, die Unternehmen erzeugen, die passenden Werkzeuge braucht, um sie richtig verwalten. Denn mit einer großen Menge an Daten kommt in der Tat große Verantwortung! Damit Unternehmen wirklich von ihren Daten profitieren können, müssen sie mit einer Lösung ausgestattet sein, die Menschen, die „data-driven“ sind, in die Lage versetzt, ihre Datenbestände einfach zu finden, zu entdecken, zu verwalten und vor allem: ihren Datenbeständen zu vertrauen.

A Datenkatalogder erstellt wurde, um alle Unternehmensdaten zu vereinheitlichen, ermöglicht es Datenmanagern und -nutzern, die Produktivität und Effizienz bei der Arbeit mit ihren Daten zu verbessern.

2017 erklärte Gartner Datenkataloge als "das neue Schwarz im Datenmanagement und in der Analytik". In "Augmented Data Catalogs: Now an Enterprise Must-Have for Data and Analytics Leaders", heißt es:

„Die Nachfrage nach Datenkatalogen steigt rasant, da Unternehmen weiterhin mit dem Auffinden, Inventarisieren und Analysieren von weit verteilten und vielfältigen Datenbeständen zu kämpfen haben.“

In diesem Artikel erfahren Sie alles, was Sie über Datenkataloge für Unternehmen wissen müssen, die wirklich data-driven werden wollen.  

Was genau ist ein Datenkatalog?

Bevor man sich mit dem Thema Datenkatalogisierung beschäftigt, ist es wichtig, das Konzept des Metadaten-Managements zu verstehen. Ein Datenkatalog verwendet Metadaten - Daten über Daten - um ein durchsuchbares Repository aller Informationsbestände eines Unternehmens zu erstellen. Diese Metadaten, die von verschiedenen Datenquellen (Big Data, Cloud-Services, Excel-Sheets etc.) gesammelt werden, werden automatisch gescannt, um es den Nutzern des Katalogs zu ermöglichen, nach ihren Daten zu suchen und Informationen wie die Verfügbarkeit, Frische und Qualität eines Datenassets zu erhalten.

Daher ist per Definition ein Datenkatalog zu einem Standard für effizientes Metadaten geworden. Wir definieren einen Datenkatalog ganz allgemein als:

"Ein detailliertes Inventar aller Datenbestände in einem Unternehmen und ihrer Metadaten, das Datenexperten helfen soll, schnell die am besten geeigneten Daten für jeden analytischen Geschäftszweck zu finden."

Was ist der Zweck eines Datenkatalog?

Datenthemen gelten immer noch als extrem technischer Bereich. Dateninnovation ist jedoch nur möglich, wenn sie von möglichst vielen Menschen geteilt wird. Genau das ist der Zweck eines Datenkatalog: den den Zugang zu Daten zu demokratisieren.

Ein Datenkatalog verschiedenen Personen oder Endnutzern dienen. All diese Endnutzer – Datenanalysten, Datenverwalter, Datenwissenschaftler, Geschäftsanalysten und viele andere – haben unterschiedliche Erwartungen, Bedürfnisse, Profile und Herangehensweisen beim Verständnis von Daten. Da immer mehr Menschen Daten nutzen und mit ihnen arbeiten, Datenkatalog sich ein Datenkatalog an alle Endnutzer anpassen. Tatsächlich keine technischen Fachkenntnisse , um Datenlandschaft eines Unternehmens zu durchsuchen, zu entdecken und zu verstehen.

Was sind die Vorteile eines Datenkatalog?

Wie bereits erwähnt, zentralisiert und vereinheitlicht ein Datenkatalog die gesammelten Metadaten , so dass sie mit IT-Teams und Geschäftsfunktionen geteilt werden können. Diese einheitliche Sicht auf die Daten ermöglicht es Organisationen,:

Beschleunigung der Daten-Discovery

Da jeden Tag Tausende von Datensätzen und Datenbeständen erstellt werden, haben Unternehmen Schwierigkeiten, ihre Informationen zu verstehen und daraus Erkenntnisse zu gewinnen, um einen Mehrwert zu schaffen. Viele aktuelle Umfragen zeigen, dass Data-Science-Teams 80 % ihrer Zeit damit verbringen, ihre Daten vorzubereiten und zu ordnen, anstatt sie zu analysieren und auszuwerten. Der Einsatz eines Datenkatalog kann die Geschwindigkeit der Daten-Discovery um das bis zu 5-fache erhöhen. So können sich Datenteams auf das Wesentliche konzentrieren: die rechtzeitige Bereitstellung ihrer Datenprojekte.

Aufrechterhaltung einer Datenkultur

Genau wie die Organisations- oder Unternehmenskulturbezieht sich die Datenkultur auf ein Arbeitsumfeld, in dem Entscheidungen auf der Grundlage von emphatischen und empirischen Datenbeweisen getroffen werden. Ein Datenkatalog ermöglicht es, dass Datenwissen nicht länger auf eine Gruppe von Experten beschränkt ist: Er ermöglicht es Organisationen, besser mit ihren Informationsbeständen zusammenzuarbeiten.

Aufbau einer agilen Data Governance

Anstatt übermäßig komplexe und schwer zu pflegende Prozesse für angenommene Informationen zu implementieren, ermöglichen Datenkataloge einen agilen Bottom-up-Ansatz für Data Governance . Ein Datenkatalog ermöglicht es Datenanwendern, ein Datenprozessregister zu erstellen, rechtliche Verpflichtungen zu dokumentieren, den Lebenszyklus von Daten zu verfolgen sowie sensible Informationen zu identifizieren. All dies geschieht in einem einzigen zentralen Lager.

Maximieren Sie den Wert der Daten

Durch das Sammeln aller Daten eines Unternehmens in einem Referenzdaten-Tool wird es möglich, Querverweise auf diese Bestände zu ziehen und den Wert dieser Daten einfacher zu nutzen. Die Zusammenarbeit von technischen und fachlichen Teams innerhalb des Datenkatalog ermöglicht Innovationen, die bewährte Marktbedürfnisse kennenlernen .

Besser und schneller produzieren

Mehr als 70% der Zeit, die für die Datenanalyse aufgewendet wird, wird in "Datenstreitigkeiten" investiert. Die Katalogisierung vereinfacht den Datenabruf, die Identifikation von zugehörigen Kontakten und damit die data-driven Entscheidungsfindung.

Gute Kontrolle über Daten sicherstellen

Fehlinterpretiert oder fehlerhaft, setzen sich Unternehmen dem Risiko aus, ihre Entscheidung auf falsche Informationen zu stützen. verbundene Daten ermöglichen den Zugriff auf stets aktuelle Daten. Datennutzer können sich vergewissern, dass die Daten und ihre Informationen korrekt und verwertbar sind.

Worauf ist bei einem Datenkatalogzu achten?

Eine flexible und anpassungsfähige Metamodell-Vorlage

Ein Datenkatalog sollte automatisch Metadaten aus den Datenquellen eines Unternehmens erfassen und aktualisieren. Über eine flexible Metamodellvorlage sollte es möglich sein, katalogisierten Datensätzen Dokumentationsmerkmale hinzuzufügen, zu konfigurieren und zu überlagern - durch den Datenkatalog. Auf diese Weise bietet der Katalog eine einfache und modulare Möglichkeit, Dokumentationsvorlagen entsprechend den Zielen und Prioritäten des Unternehmens zu konfigurieren.

Eine intelligente Suchmaschine

Eine der Kernfunktionen eines Datenkatalog ist eine Suchmaschine. Alle indizierten Metadaten sollten über eine Suchleiste durchsuchbar sein. Durch einfache Stichwortsuchen sollte ein Datenkatalog in der Lage sein, einem abfragen die genauesten Ergebnisse zu zeigen. Er sollte es den Nutzern auch ermöglichen, ihre Suchergebnisse zu filtern. Eine intelligente Suchmaschine optimiert auch die Ergebnisse auf der Grundlage des Profils und der Präferenzen des Nutzer. Eine intelligente Suchmaschine ermöglicht es den Nutzern also, ihre Informationsbestände schnell zu finden.

Ein Wissensdiagramm

Das Vorhandensein eines Wissensgraphen ist für jedes Datenkatalogisierungsprojekt unerlässlich. Der Wissensgraph repräsentiert verschiedene Konzepte und verbindet Objekte durch semantische oder statische Links miteinander. Der Wissensgraph eines Datenkatalogbietet den Nutzern daher reichhaltige und tiefgehende Suchergebnisse, optimierte Daten-Discovery, intelligente Empfehlungen und mehr.

Data Lineage

Mit Daten-Abstammungist es möglich, den Ursprung und die Umwandlungen eines bestimmten Datensatzes im Laufe der Zeit vollständig zu visualisieren. So können die Nutzer verstehen, woher die Daten stammen, wann und wo sie sich trennen und mit anderen Daten verschmelzen. Diese Umwandlungen und Behandlungen der Daten sind für die Einhaltung der DSGVO und anderer Datenvorschriften unerlässlich.

Ein Wirtschaftsglossar

Ein Geschäftsglossar ermöglicht es Datenkonsumenten, ein gemeinsames Geschäftsvokabular verwalten und es im gesamten Unternehmen verfügbar zu machen. Diese unverzichtbare Funktion liefert klare Bedeutungen und Kontext für Datenbegriffe.

Was sind die Use Cases eines Datenkatalog? Und für wen?

Für Chief Data Officers

Die Leiter der Datenabteilung spielt eine Schlüsselrolle in der gesamten Datenstrategie eines Unternehmens; seine Aufgabe ist es, seine Daten zu beherrschen und den Zugang zu ihnen zu erleichtern, um data-driven zu werden. Ein Datenkatalog hilft ihnen dabei:

  • Gewährleistung der Zuverlässigkeit und des Werts der Daten.
  • Erstellen einer datenkompetente Organisation.
  • Aufwertung des Kontexts eines Datensatzes für Datenexplorer.
  • Vermitteln Sie eine Datenkultur mit Rechten und Pflichten.
  • Starten Sie einen Prozess zur Einhaltung der europäischen Verordnung (GDPR).

Für Datenverwalter

Der Datenverwalter gilt aufgrund seines technischen und betrieblichen Fachwissens als Hauptansprechpartner für Datenanfragen. Der Datenverwalter wird meist als „Master of Data“ bezeichnet. Ein Datenkatalog Datenverwalter dem Datenverwalter :

  • Zentralisierung des Datenwissens auf einer einzigen Plattform.
  • Anreicherung der Datendokumentation.
  • Stellen Sie die Kommunikation zwischen ihnen und den Datenexplorern her.
  • Qualifizieren Sie den Wert der Daten.

Für Datenwissenschaftler

Um ihre Aufgaben zu erfüllen, müssen die Endnutzer in der Lage sein, schnell die richtigen Daten für ihre Anwendungsfälle zu finden, zu entdecken und zu verstehen. Ein Datenkatalog hilft ihnen dabei:

  • Einfaches Auffinden von Daten über eine Suchmaschine
  • Einsicht in die Historie ihrer Informationen: Datum der Erstellung und der durchgeführten Aktionen
  • den Kontext ihrer Daten zu verstehen
  • Identifizieren Sie die zugehörigen Personen
  • Leichte Zusammenarbeit mit Kollegen.

Eine repräsentativeMigration

Ein Datenkatalog ist in den verschiedenen Phasen Ihrer Projekte äußerst nützlich:

Ein Datenkatalog in der Deployment

Verbinden Sie sich mit Ihren Datenquellen – Ein Datenkatalog mit all Ihren Datenquellen Datenkatalog . Verbinden Sie Ihre Lösungen für Datenintegration, Datenaufbereitung, Datenvisualisierung, CRM usw., um alle Ihre Technologien vollständig in eine zentrale Datenquelle zu integrieren. 

Ein Datenkatalog in der Dokumentationsphase

Erstellen eines Metamodells - Ein Datenkatalog erfasst und aktualisiert technische und operative Metadaten aus den Datenquellen eines Unternehmens. Er ermöglicht es Ihnen, den katalogisierten Datenbeständen Informationen hinzuzufügen und zu konfigurieren - durch den Datenkatalog- oder sie zu überlagern (Informationen, die obligatorisch sein können oder nicht).

Ein Datenkatalog in der Discovery-Phase

Verstehen Sie Ihre Daten - Mit einem Datenkatalog sind Datenbürger - mit oder ohne technische Fähigkeiten - in der Lage, ihre Unternehmensdaten vollständig zu verstehen. Ein Datenkatalog ermöglicht es den Benutzern, auf alle Informationen innerhalb des Katalogs zuzugreifen und diese einfach zu suchen.

Definieren Sie Ihre Daten – Ein Datenkatalog Datenverantwortlichen wie Datenverwalter Chief Data Officers, die relevanten Daten, die verwendet werden sollen, korrekt zu definieren. Mithilfe von Metadaten können Datenmanager ihre Datensätze einfach dokumentieren, sodass ihre Datenteams auf kontextbezogene Daten zugreifen können. 

kennenlernen Sie Ihre Datenkennenlernen - Entdecken und sammeln Sie verfügbare Daten in einem Datenkatalog. Durch die Katalogisierung aller Unternehmensdaten in einem zentralen Lager können Datenbürger sicherstellen, dass ihre Daten zuverlässig und nutzbar sind.

Ein Datenkatalog in der Kollaborationsphase

Mit Daten kommunizieren - Ein Datenkatalog ermöglicht es den Nutzern, mit Daten umzugehen. Sowohl die IT- als auch die Fachabteilungen sind in der Lage, verschiedene Datenprojekte zu verstehen und darüber zu kommunizieren. Durch kollaborative Funktionen wie Diskussionen werden Daten zu einem Thema, das alle im Unternehmen teilen können.

Starten Sie Ihre Migration

Die Actian Data Intelligence-Plattform ist eine 100%ige Cloud-Lösung, die mit wenigen Klicks überall auf der Welt verfügbar ist. Wenn Sie sich für die Actian Data Intelligence Platform entscheiden, bieten Sie Ihren Datenteams die beste Umgebung der nächsten Generation, um Ihre Datenbestände zu finden, zu verstehen und zu nutzen.

Sehen Sie sich unsere beiden Anwendungen an:

  • Actian Studio - Ermöglichen Sie Ihren Datenmanagement , die Dokumentation der Datenbestände ihres Unternehmens verwalten, zu pflegen und zu erweitern.
  • Actian Explorer - Bieten Sie Ihren Datenteams eine Nutzer Oberfläche und maßgeschneiderte Explorationspfade, um ihre Daten-Discovery effizienter zu gestalten.

FAQ

Ein Datenkatalog eine detaillierte Bestandsaufnahme aller Datenbestände einer Organisation und ihrer Metadaten, die Datenfachleuten dabei helfen soll, schnell die für einen bestimmten analytischen Geschäftszweck am besten geeigneten Daten zu finden.

Ein Datenkatalog den Datenzugriff, beschleunigt Daten-Discovery zu Fünffache und ermöglicht es Unternehmen, bei der Arbeit mit Informationsressourcen besser zusammenzuarbeiten, während gleichzeitig der Zeitaufwand der Datenteams für die Datenaufbereitung im Vergleich zur Datenanalyse reduziert wird.

Zu den wichtigsten Funktionen gehören eine flexible Metamodellvorlage zur Erfassung Metadaten, eine intelligente Suchmaschine zum Auffinden von Datenbeständen, ein Wissensgraph zur Verknüpfung von Datenkonzepten, Data Lineage zur Nachverfolgung von Datenumwandlungen sowie ein Geschäftsglossar Verwaltung eines gemeinsamen Vokabulars.

Ein Datenkatalog einen umfassenden, durchsuchbaren Überblick über alle Datenbestände mit Funktionen wie Suche, Datenherkunft und Governance, während sich ein Datenwörterbuch hauptsächlich auf technische Metadaten die Datenmodellierung und das Datenbankdesign konzentriert.

Ein Datenkatalog Data Governance agile, von der Basis ausgehende Data Governance er es den Benutzern ermöglicht, ein Datenprozessregister anzulegen, gesetzliche Verpflichtungen zu dokumentieren, den Datenlebenszyklus zu verfolgen, sensible Informationen zu identifizieren und die Einhaltung der DSGVO sicherzustellen – und das alles in einem einzigen zentralen Lager.

Chief Data Officers nutzen es, um die Zuverlässigkeit der Daten zu gewährleisten und datenkompetente Organisationen zu schaffen; Data Stewards nutzen es, um Wissen zu bündeln und die Dokumentation zu verbessern; und Data Scientists nutzen es, um die richtigen Daten für ihre Projekte schnell zu finden, zu verstehen und gemeinsam daran zu arbeiten.

Die Datenherkunftsverfolgung visualisiert die Herkunft und die Veränderungen bestimmter Daten im Zeitverlauf und ermöglicht es den Nutzern so, nachzuvollziehen, woher die Daten stammen und wie sie sich verändern – was für die Einhaltung der DSGVO und anderer Datenschutzvorschriften unerlässlich ist.

Durch die Zentralisierung Metadaten einem durchsuchbaren Lager intelligenten Fähigkeiten Datenkatalog ein Datenkatalog die Geschwindigkeit der Daten-Discovery zu Fünffache steigern, sodass sich Datenteams auf die Analyse statt auf die Datenaufbereitung konzentrieren können.