Leitfaden zum Datenqualitätsmanagement #4 - Datenkatalog Beitrag zum DQM
Actian Germany GmbH
April 4, 2022

Unter Datenqualität versteht man die Fähigkeit eines Unternehmens, die Qualität seiner Daten auf Dauer zu erhalten. Glaubt man einigen Datenexperten, so ist die Verbesserung der Datenqualität das Allheilmittel für alle unsere geschäftlichen Probleme und sollte daher oberste Priorität haben.
Wir glauben, dass dies nuanciert sein sollte: Datenqualität ist unter anderem ein Mittel, um die Unsicherheiten beim Erreichen der Unternehmensziele zu begrenzen.
In dieser Artikelserie gehen wir auf alles ein, was Datenexperten über Datenqualitätsmanagement (DQM) wissen müssen:
- Die neun Dimensionen der Datenqualität
- Die mit der Datenqualität verbundenen Herausforderungen und Risiken
- Die wichtigsten Merkmale von Datenqualitätsmanagement-Tools
- Der Datenkatalog zum DQM
Ein Datenkatalog ist kein DQM-Tool
Ein wesentliches Element ist, dass ein Datenkatalog nicht als ein Datenqualitätsmanagement-Tool per se betrachtet werden sollte.
Zunächst einmal ist eines der Kernprinzipien der Datenqualität, dass die Kontrollen idealerweise im Quellsystem stattfinden sollten. Die Durchführung dieser Kontrollen ausschließlich im Datenkatalog - und nicht an der Quelle und im Datenumwandlungsfluss - erhöht die Gesamtkosten des Vorhabens.
Darüber hinaus muss ein Datenkatalog sowohl umfassend als auch einfach sein, um seine rasche Deployment im Unternehmen zu erleichtern. Dies ist mit der Komplexität der Datentransformation und der Vielzahl von Werkzeugen, die zur Durchführung dieser Transformationen verwendet werden, einfach nicht vereinbar.
Schließlich wird ein Datenkatalog ein einfach zu verstehendes und zu benutzendes Instrument bleiben.
Wie trägt ein Datenkatalog zum DQM bei?
Der Datenkatalog ist zwar kein Data-Quality-Tool, aber sein Beitrag zur Aufrechterhaltung der Datenqualität ist dennoch erheblich. Hier ist wie:
- Ein Datenkatalog ermöglicht es Datenkonsumenten, Metadaten leicht zu verstehen und gefährliche Interpretationen zu vermeiden der Daten zu vermeiden. Er spiegelt die Dimension der Klarheit von Qualität wider;
- Ein Datenkatalog bietet eine zentrale Sicht auf alle verfügbaren Unternehmensdaten. Data-Quality-Informationen sind daher Metadaten wie alle anderen, die Wert tragen und allen zur Verfügung gestellt werden sollten. Sie sind leicht zu interpretieren und zu extrahieren, ein Echo der Dimensionen Genauigkeit, Gültigkeit, Beständigkeit, Eindeutigkeit, Vollständigkeit und Aktualität.
- Ein Datenkatalog hat die Fähigkeit zur Rückverfolgbarkeit von Daten (Data Lineage), die die Dimension der Rückverfolgbarkeit von Qualität widerspiegelt;
- Ein Datenkatalog ermöglicht in der Regel den direkten Zugriff auf die Datenquellenund spiegelt damit die Dimension der Verfügbarkeit von Qualität wider.
Die Umsetzungsstrategie des DQM
Die folgende Tabelle zeigt, wie die Datenqualität je nach den verschiedenen Lösungen auf dem Markt berücksichtigt wird:
Wie bereits erwähnt, sollten Qualitätstests standardmäßig direkt im Quellsystem durchgeführt werden. Die Integration von Qualitätstests in einen Datenkatalog kann die Nutzer verbessern, ist aber angesichts seiner Einschränkungen kein Muss, da die Datenqualität nicht in den Transformationsfluss integriert ist.
Wenn die Systemstapel jedoch zu komplex werden und wir beispielsweise Daten aus verschiedenen Systemen mit unterschiedlichen Funktionsregeln konsolidieren müssen, wird ein Datenqualitätstool unumgänglich.
Die Implementierungsstrategie hängt von den Anwendungsfällen und Unternehmenszielen ab. Es ist jedoch ratsam, die Datenqualität schrittweise zu implementieren:
- Vergewissern Sie sich, dass die Quellsysteme die entsprechenden Qualitätsregeln eingeführt haben;
- Einführung eines Datenkatalog zur Verbesserung der Qualität in Bezug auf Klarheit, Nachvollziehbarkeit und/oder Verfügbarkeit;
- Integrieren Sie Data Quality mit einem spezialisierten Tool in die Transformationsströme und importieren Sie diese Informationen automatisch über APIs in den Datenkatalog .
Schlussfolgerung
Datenqualität bezieht sich auf die Fähigkeit eines Unternehmens, die Nachhaltigkeit seiner Daten im Laufe der Zeit zu erhalten. Wir definieren sie durch das Prisma von neun der sechzig von DAMA International beschriebenen Dimensionen: Vollständigkeit, Genauigkeit, Gültigkeit, Einzigartigkeit, Beständigkeit, Aktualität, Nachvollziehbarkeit, Klarheit und Verfügbarkeit.
Als Anbieter von Datenkatalog lehnen wir die Vorstellung ab, dass ein Datenkatalog ein vollwertiges Qualitätsmanagement-Tool ist. Vielmehr ist er nur eine von mehreren Möglichkeiten, zur Verbesserung der Datenqualität beizutragen, vor allem durch die Dimensionen Klarheit, Verfügbarkeit und Nachvollziehbarkeit.
Holen Sie sich unseren Leitfaden zum Datenqualitätsmanagement für data driven Organisationen
Wenn Sie weitere Informationen über Datenqualität und DQM wünschen, laden Sie unseren kostenlosen Leitfaden herunter: "Leitfaden zum Datenqualitätsmanagement" jetzt herunterladen! Laden Sie das eBook herunter.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden: Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.