Data Intelligence

Was ist ein Datenkatalog?

Actian Germany GmbH

Februar 12, 2019

Was ist ein Datenkatalog Landing Cover?

Es ist kein Geheimnis, dass die enormen Informationsmengen, die Unternehmen erzeugen, die richtigen Werkzeuge erfordern, um sie richtig verwalten . In der Tat, mit großen Daten kommt große Verantwortung! Damit Unternehmen wirklich von ihren Daten profitieren können, müssen sie mit einer Lösung ausgestattet sein, die es data driven Menschen ermöglicht, ihre Datenbestände einfach zu finden, zu entdecken, verwalten und vor allem zu vertrauen.

Ein Datenkatalogder erstellt wurde, um alle Unternehmensdaten zu vereinheitlichen, ermöglicht es Datenmanagern und -nutzern, die Produktivität und Effizienz bei der Arbeit mit ihren Daten zu verbessern.

2017 erklärte Gartner Datenkataloge als "das neue Schwarz im Datenmanagement und in der Analytik". In "Augmented Data Catalogs: Now an Enterprise Must-Have for Data and Analytics Leaders", heißt es:

"Die Nachfrage nach Datenkatalogen steigt rasant, da Unternehmen weiterhin mit dem Auffinden, Inventarisieren und Analysieren von weit verteilten und vielfältigen Datenbeständen zu kämpfen haben."

In diesem Artikel erfahren Sie alles, was Sie über Datenkataloge für Unternehmen wissen müssen, die wirklich data driven werden wollen.  

Was genau ist ein Datenkatalog?

Bevor man sich mit dem Thema Datenkatalogisierung beschäftigt, ist es wichtig, das Konzept des Metadaten . Ein Datenkatalog verwendet Metadaten - Daten über Daten - um ein durchsuchbares Lager aller Informationsbestände eines Unternehmens zu erstellen. Diese Metadaten, die von verschiedenen DatenquellenBig Data, Cloud , Excel-Sheets, etc.) gesammelt werden, werden automatisch gescannt, um es den Nutzern des Katalogs zu ermöglichen, nach ihren Daten zu suchen und Informationen wie die Verfügbarkeit, Frische und Qualität eines Datenassets zu erhalten.

Daher ist per Definition ein Datenkatalog zu einem Standard für effizientes Metadaten geworden. Wir definieren einen Datenkatalog ganz allgemein als:

"Ein detailliertes Inventar aller Datenbestände in einem Unternehmen und ihrer Metadaten, das Datenexperten helfen soll, schnell die am besten geeigneten Daten für jeden analytischen Geschäftszweck zu finden."

Was ist der Zweck eines Datenkatalog?

Datenthemen gelten immer noch als extrem technischer Bereich. Dateninnovation ist jedoch nur möglich, wenn sie von möglichst vielen Menschen geteilt wird. Genau das ist der Zweck eines Datenkatalog: den den Zugang zu Daten zu demokratisieren.

Ein Datenkatalog ist für verschiedene Personen oder Endnutzer gedacht. Alle diese Endnutzer - Datenanalysten, Datenverwalter, Datenwissenschaftler, Geschäftsanalysten und viele mehr - haben unterschiedliche Erwartungen, Bedürfnisse, Profile und Wege, Daten zu verstehen. Da immer mehr Menschen Daten nutzen und mit ihnen arbeiten, muss sich ein Datenkatalog an alle Endnutzer anpassen. In der Tat, Datenkataloge erfordern kein technisches Fachwissen um die Datenlandschaft eines Unternehmens zu suchen, zu entdecken und zu verstehen.

Was sind die Vorteile eines Datenkatalog?

Wie bereits erwähnt, zentralisiert und vereinheitlicht ein Datenkatalog die gesammelten Metadaten , so dass sie mit IT-Teams und Geschäftsfunktionen geteilt werden können. Diese einheitliche Sicht auf die Daten ermöglicht es Organisationen,:

Beschleunigung der Daten-Discovery

Da jeden Tag Tausende von Datensätzen und Datenbeständen erstellt werden, haben Unternehmen Schwierigkeiten, ihre Informationen zu verstehen und daraus Erkenntnisse zu gewinnen, um einen Mehrwert zu schaffen. Viele aktuelle Umfragen zeigen, dass data science 80 % ihrer Zeit damit verbringen, ihre Daten vorzubereiten und zu ordnen, anstatt sie zu analysieren und auszuwerten. Durch den Einsatz eines Datenkatalog kann die Geschwindigkeit der Daten-Discovery um das bis zu 5-fache erhöhen. Auf diese Weise können sich Datenteams auf das Wesentliche konzentrieren: die rechtzeitige Bereitstellung ihrer Datenprojekte.

Aufrechterhaltung einer Datenkultur

Genau wie die Organisations- oder Unternehmenskulturbezieht sich die Datenkultur auf ein Arbeitsumfeld, in dem Entscheidungen auf der Grundlage von emphatischen und empirischen Datenbeweisen getroffen werden. Ein Datenkatalog ermöglicht es, dass Datenwissen nicht länger auf eine Gruppe von Experten beschränkt ist: Er ermöglicht es Organisationen, besser mit ihren Informationsbeständen zusammenzuarbeiten.

Aufbau einer agilen Data Governance

Anstatt übermäßig komplexe Prozesse zu implementieren, die zu schwierig sind, um sie für angenommene Informationen aufrechtzuerhalten, ermöglichen Datenkataloge einen agilen Bottom-up-Ansatz für data governance . Mit einem Datenkatalog können Datenanwender ein Datenprozessregister erstellen, rechtliche Verpflichtungen dokumentieren, den Lebenszyklus von Daten verfolgen und sensible Informationen identifizieren. All dies geschieht in einem einzigen zentralen Lager.

Maximieren Sie den Wert der Daten

Durch das Sammeln aller Daten eines Unternehmens in einem Referenzdaten-Tool wird es möglich, Querverweise auf diese Bestände zu ziehen und den Wert dieser Daten einfacher zu nutzen. Die Zusammenarbeit von technischen und fachlichen Teams innerhalb des Datenkatalog ermöglicht Innovationen, die bewährte Marktbedürfnisse kennenlernen .

Besser und schneller produzieren

Mehr als 70% der Zeit, die für die Datenanalyse aufgewendet wird, wird in "Datenstreitigkeiten" investiert. Die Katalogisierung vereinfacht den Datenabruf, die Identifikation von zugehörigen Kontakten und damit die data driven Entscheidungsfindung.

Gute Kontrolle über Daten sicherstellen

Fehlinterpretiert oder fehlerhaft, setzen sich Unternehmen dem Risiko aus, ihre Entscheidung auf falsche Informationen zu stützen. verbundene Daten ermöglichen den Zugriff auf stets aktuelle Daten. Datennutzer können sich vergewissern, dass die Daten und ihre Informationen korrekt und verwertbar sind.

Worauf ist bei einem Datenkatalogzu achten?

Eine flexible und anpassungsfähige Metamodell-Vorlage

Ein Datenkatalog sollte automatisch Metadaten aus den Datenquellen eines Unternehmens erfassen und aktualisieren. Über eine flexible Metamodellvorlage sollte es möglich sein, katalogisierten Datensätzen Dokumentationsmerkmale hinzuzufügen, zu konfigurieren und zu überlagern - durch den Datenkatalog. Auf diese Weise bietet der Katalog eine einfache und modulare Möglichkeit, Dokumentationsvorlagen entsprechend den Zielen und Prioritäten des Unternehmens zu konfigurieren.

Eine intelligente Suchmaschine

Eine der Kernfunktionen eines Datenkatalog ist eine Suchmaschine. Alle indizierten Metadaten sollten über eine Suchleiste durchsuchbar sein. Ein Datenkatalog sollte in der Lage sein, durch einfache Stichwortsuche die genauesten Ergebnisse zu einer Anfrage anzuzeigen. Sie sollte es den Nutzern auch ermöglichen, ihre Suchergebnisse zu filtern. Eine intelligente Suchmaschine optimiert die Ergebnisse auch auf der Grundlage des Profils und der Präferenzen des Nutzer. Eine intelligente Suchmaschine ermöglicht es den Nutzern also, ihre Informationsbestände schnell zu finden.

Ein Wissensdiagramm

Das Vorhandensein eines Wissensgraphen ist für jedes Datenkatalogisierungsprojekt unerlässlich. Der Wissensgraph repräsentiert verschiedene Konzepte und verbindet Objekte durch semantische oder statische Links miteinander. Der Wissensgraph eines Datenkatalogbietet den Nutzern daher reichhaltige und tiefgehende Suchergebnisse, optimierte Daten-Discovery, intelligente Empfehlungen und mehr.

Data Lineage

Mit Daten-Abstammungist es möglich, den Ursprung und die Umwandlungen eines bestimmten Datensatzes im Laufe der Zeit vollständig zu visualisieren. So können die Nutzer verstehen, woher die Daten stammen, wann und wo sie sich trennen und mit anderen Daten verschmelzen. Diese Umwandlungen und Behandlungen der Daten sind für die Einhaltung der DSGVO und anderer Datenvorschriften unerlässlich.

Ein Wirtschaftsglossar

Ein Geschäftsglossar ermöglicht es Datenkonsumenten, ein gemeinsames Geschäftsvokabular verwalten und es im gesamten Unternehmen verfügbar zu machen. Diese unverzichtbare Funktion liefert klare Bedeutungen und Kontext für Datenbegriffe.

Was sind die Use Cases eines Datenkatalog? Und für wen?

Für Chief Data Officers

Die Verantwortlicher für Daten spielt eine Schlüsselrolle in der gesamten Datenstrategie eines Unternehmens; seine Aufgabe ist es, die Daten zu beherrschen und den Zugang zu ihnen zu erleichtern, um data driven zu werden. Ein Datenkatalog hilft ihnen dabei:

  • Gewährleistung der Zuverlässigkeit und des Werts der Daten.
  • Erstellen einer datenkompetente Organisation.
  • Aufwertung des Kontexts eines Datensatzes für Datenexplorer.
  • Vermitteln Sie eine Datenkultur mit Rechten und Pflichten.
  • Starten Sie einen Prozess zur Einhaltung der europäischen Verordnung (GDPR).

Für Datenverwalter

Der Data Steward ist dank seiner technischen und betrieblichen Kenntnisse als Hauptansprechpartner für Datenanfragen bekannt. Datenverwalter meist als der "Meister der Daten" bezeichnet. Ein Datenkatalog ermöglicht es den Data Stewards,:

  • Zentralisierung des Datenwissens auf einer einzigen Plattform.
  • Anreicherung der Datendokumentation.
  • Stellen Sie die Kommunikation zwischen ihnen und den Datenexplorern her.
  • Qualifizieren Sie den Wert der Daten.

Für Datenwissenschaftler

Um ihre Aufgaben zu erfüllen, müssen die Endnutzer in der Lage sein, schnell die richtigen Daten für ihre Anwendungsfälle zu finden, zu entdecken und zu verstehen. Ein Datenkatalog hilft ihnen dabei:

  • Einfaches Auffinden von Daten über eine Suchmaschine
  • Einsicht in die Historie ihrer Informationen: Datum der Erstellung und der durchgeführten Aktionen
  • den Kontext ihrer Daten zu verstehen
  • Identifizieren Sie die zugehörigen Personen
  • Leichte Zusammenarbeit mit Kollegen.

Eine repräsentativeMigration

Ein Datenkatalog ist in den verschiedenen Phasen Ihrer Projekte äußerst nützlich:

Ein Datenkatalog in der Deployment

Verbinden Sie sich mit Ihren Datenquellen - Ein Datenkatalog verbindet sich mit all Ihren Datenquellen. Verbinden Sie Ihre Datenintegrations-, Datenaufbereitungs-, Datenvisualisierungs-, CRM-Lösungen usw., um alle Ihre Technologien vollständig in eine einzige Wahrheitsquelle zu integrieren.

Ein Datenkatalog in der Dokumentationsphase

Erstellen eines Metamodells - Ein Datenkatalog erfasst und aktualisiert technische und operative Metadaten aus den Datenquellen eines Unternehmens. Er ermöglicht es Ihnen, den katalogisierten Datenbeständen Informationen hinzuzufügen und zu konfigurieren - durch den Datenkatalog- oder sie zu überlagern (Informationen, die obligatorisch sein können oder nicht).

Ein Datenkatalog in der Discovery-Phase

Verstehen Sie Ihre Daten - Mit einem Datenkatalog sind Datenbürger - mit oder ohne technische Funktionen - in der Lage, ihre Unternehmensdaten vollständig zu verstehen. Ein Datenkatalog ermöglicht es den Nutzern, auf alle Informationen innerhalb des Katalogs zuzugreifen und diese einfach zu suchen.

Definieren Sie Ihre Daten - Ein Datenkatalog ermöglicht es Datenverantwortlichen, wie z.B. Data Stewards oder Chief Data Officers, die zu verwendenden Daten korrekt zu definieren. Mit Metadaten können Datenmanager ihre Datensätze einfach dokumentieren, so dass ihre Datenteams auf kontextualisierte Daten zugreifen können.

kennenlernen Sie Ihre Datenkennenlernen - Entdecken und sammeln Sie verfügbare Daten in einem Datenkatalog. Durch die Katalogisierung aller Unternehmensdaten in einem zentralen Lager können Datenbürger sicherstellen, dass ihre Daten zuverlässig und nutzbar sind.

Ein Datenkatalog in der Kollaborationsphase

Mit Daten kommunizieren - Ein Datenkatalog ermöglicht es den Nutzern, mit Daten umzugehen. Sowohl die IT- als auch die Fachabteilungen sind in der Lage, verschiedene Datenprojekte zu verstehen und darüber zu kommunizieren. Durch kollaborative Funktionen wie Diskussionen werden Daten zu einem Thema, das alle im Unternehmen teilen können.

Starten Sie Ihre Migration

Die Actian Data Intelligence-Plattform ist eine 100%ige Cloud Lösung, die mit wenigen Klicks überall auf der Welt verfügbar ist. Wenn Sie sich für die Actian Data Intelligence Platform entscheiden, bieten Sie Ihren Datenteams die beste Umgebung der nächsten Generation, um Ihre Datenbestände zu finden, zu verstehen und zu nutzen.

Sehen Sie sich unsere beiden Anwendungen an:

  • Actian Studio - Ermöglichen Sie Ihren Datenmanagement , die Dokumentation der Datenbestände ihres Unternehmens verwalten, zu pflegen und zu erweitern.
  • Actian Explorer - Bieten Sie Ihren Datenteams eine Nutzer Oberfläche und maßgeschneiderte Explorationspfade, um ihre Daten-Discovery effizienter zu gestalten.
actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, verwalten und Analyse von Daten in Cloud, Hybrid- und On-Premises . Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und Analytik liefert Actian High-Performance Lösungen, die Unternehmen in die Lage versetzen, data driven Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und hat Branchenauszeichnungen für Leistung und Innovation erhalten. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im Actian-Blog behandeln wir Themen, die von Dateneingang bis hin zu KI-gesteuerter Analytik reichen.