Ein Datenkatalogder erstellt wurde, um alle Unternehmensdaten zu vereinheitlichen, ermöglicht es Datenmanagern und -nutzern, die Produktivität und Effizienz bei der Arbeit mit ihren Daten zu verbessern.
2017 erklärte Gartner Datenkataloge als "das neue Schwarz im Datenmanagement und in der Analytik". In "Augmented Data Catalogs: Now an Enterprise Must-Have for Data and Analytics Leaders", heißt es:
"Die Nachfrage nach Datenkatalogen steigt rasant, da Unternehmen weiterhin mit dem Auffinden, Inventarisieren und Analysieren von weit verteilten und vielfältigen Datenbeständen zu kämpfen haben."
In diesem Artikel erfahren Sie alles, was Sie über Datenkataloge für Unternehmen wissen müssen, die wirklich data driven werden wollen.
Was genau ist ein Datenkatalog?
Bevor man sich mit dem Thema Datenkatalogisierung beschäftigt, ist es wichtig, das Konzept des Metadaten . Ein Datenkatalog verwendet Metadaten - Daten über Daten - um ein durchsuchbares Lager aller Informationsbestände eines Unternehmens zu erstellen. Diese Metadaten, die von verschiedenen DatenquellenBig Data, Cloud , Excel-Sheets, etc.) gesammelt werden, werden automatisch gescannt, um es den Nutzern des Katalogs zu ermöglichen, nach ihren Daten zu suchen und Informationen wie die Verfügbarkeit, Frische und Qualität eines Datenassets zu erhalten.
Daher ist per Definition ein Datenkatalog zu einem Standard für effizientes Metadaten geworden. Wir definieren einen Datenkatalog ganz allgemein als:
"Ein detailliertes Inventar aller Datenbestände in einem Unternehmen und ihrer Metadaten, das Datenexperten helfen soll, schnell die am besten geeigneten Daten für jeden analytischen Geschäftszweck zu finden."
Was ist der Zweck eines Datenkatalog?
Datenthemen gelten immer noch als extrem technischer Bereich. Dateninnovation ist jedoch nur möglich, wenn sie von möglichst vielen Menschen geteilt wird. Genau das ist der Zweck eines Datenkatalog: den den Zugang zu Daten zu demokratisieren.
Ein Datenkatalog ist für verschiedene Personen oder Endnutzer gedacht. Alle diese Endnutzer - Datenanalysten, Datenverwalter, Datenwissenschaftler, Geschäftsanalysten und viele mehr - haben unterschiedliche Erwartungen, Bedürfnisse, Profile und Wege, Daten zu verstehen. Da immer mehr Menschen Daten nutzen und mit ihnen arbeiten, muss sich ein Datenkatalog an alle Endnutzer anpassen. In der Tat, Datenkataloge erfordern kein technisches Fachwissen um die Datenlandschaft eines Unternehmens zu suchen, zu entdecken und zu verstehen.
Was sind die Vorteile eines Datenkatalog?
Wie bereits erwähnt, zentralisiert und vereinheitlicht ein Datenkatalog die gesammelten Metadaten , so dass sie mit IT-Teams und Geschäftsfunktionen geteilt werden können. Diese einheitliche Sicht auf die Daten ermöglicht es Organisationen,:
Beschleunigung der Daten-Discovery
Da jeden Tag Tausende von Datensätzen und Datenbeständen erstellt werden, haben Unternehmen Schwierigkeiten, ihre Informationen zu verstehen und daraus Erkenntnisse zu gewinnen, um einen Mehrwert zu schaffen. Viele aktuelle Umfragen zeigen, dass data science 80 % ihrer Zeit damit verbringen, ihre Daten vorzubereiten und zu ordnen, anstatt sie zu analysieren und auszuwerten. Durch den Einsatz eines Datenkatalog kann die Geschwindigkeit der Daten-Discovery um das bis zu 5-fache erhöhen. Auf diese Weise können sich Datenteams auf das Wesentliche konzentrieren: die rechtzeitige Bereitstellung ihrer Datenprojekte.
Aufrechterhaltung einer Datenkultur
Genau wie die Organisations- oder Unternehmenskulturbezieht sich die Datenkultur auf ein Arbeitsumfeld, in dem Entscheidungen auf der Grundlage von emphatischen und empirischen Datenbeweisen getroffen werden. Ein Datenkatalog ermöglicht es, dass Datenwissen nicht länger auf eine Gruppe von Experten beschränkt ist: Er ermöglicht es Organisationen, besser mit ihren Informationsbeständen zusammenzuarbeiten.
Aufbau einer agilen Data Governance
Anstatt übermäßig komplexe Prozesse zu implementieren, die zu schwierig sind, um sie für angenommene Informationen aufrechtzuerhalten, ermöglichen Datenkataloge einen agilen Bottom-up-Ansatz für data governance . Mit einem Datenkatalog können Datenanwender ein Datenprozessregister erstellen, rechtliche Verpflichtungen dokumentieren, den Lebenszyklus von Daten verfolgen und sensible Informationen identifizieren. All dies geschieht in einem einzigen zentralen Lager.
Maximieren Sie den Wert der Daten
Durch das Sammeln aller Daten eines Unternehmens in einem Referenzdaten-Tool wird es möglich, Querverweise auf diese Bestände zu ziehen und den Wert dieser Daten einfacher zu nutzen. Die Zusammenarbeit von technischen und fachlichen Teams innerhalb des Datenkatalog ermöglicht Innovationen, die bewährte Marktbedürfnisse kennenlernen .
Besser und schneller produzieren
Mehr als 70% der Zeit, die für die Datenanalyse aufgewendet wird, wird in "Datenstreitigkeiten" investiert. Die Katalogisierung vereinfacht den Datenabruf, die Identifikation von zugehörigen Kontakten und damit die data driven Entscheidungsfindung.
Gute Kontrolle über Daten sicherstellen
Fehlinterpretiert oder fehlerhaft, setzen sich Unternehmen dem Risiko aus, ihre Entscheidung auf falsche Informationen zu stützen. verbundene Daten ermöglichen den Zugriff auf stets aktuelle Daten. Datennutzer können sich vergewissern, dass die Daten und ihre Informationen korrekt und verwertbar sind.