Data Intelligence

Was macht einen Datenkatalog "smart"? #Nr. 5 - Nutzer Experience

Actian Germany GmbH

Februar 16, 2022

Nutzer

A Datenkatalog bündelt enorme Mengen unterschiedlichster Informationen, deren Umfang exponentiell wachsen wird. Dies wird 2 große Herausforderungen mit sich bringen:

  • Wie kann das Informationsvolumen eingespeist und gepflegt werden, ohne dass sich die Kosten für die Verwaltung derMetadaten verdreifachen (oder mehr)?
  • Wie findet man die wichtigsten Datensätze für einen bestimmten use case?

A Datenkatalog sollte intelligent sein, um diese 2 Fragen zu beantworten, mit intelligenten technologischen und konzeptionellen Merkmalen, die über die reine Integration von KI-Algorithmen hinausgehen.

In diesem Zusammenhang haben wir 5 Bereiche identifiziert, in denen ein Datenkatalog "Smart" sein kann - die meisten davon haben nichts mit Maschinelles Lernen:

  1. Metamodellierung
  2. Der Datenbestand
  3. Verwaltung von Metadaten
  4. Die Suchmaschine
  5. Erfahrungen Nutzer

Ein Datenkatalog sollte auch in Bezug auf die Erfahrungen, die er den verschiedenen Nutzergruppen bietet, intelligent sein. Eine der größten Herausforderungen beim Deployment eines Datenkatalog ist die Akzeptanz bei denjenigen, für die er gedacht ist: Datenkonsumenten. Und Nutzer spielt dabei eine wichtige Rolle.

Nutzer im Datenkatalog

Der eigentliche Zweck der Nutzer ist die Identifizierung von Personas, deren Verhalten und Ziele wir modellieren wollen, um ihnen eine elegante und effiziente grafische Schnittstelle zu bieten. Die Festlegung von Personas in einem Datenkatalog ist eine Herausforderung - es handelt sich um ein universelles Instrument, das für jedes Unternehmen, unabhängig von seiner Größe, in allen Tätigkeitsbereichen und überall auf der Welt einen Mehrwert bietet.

Anstatt zu versuchen, schwer zu definierende Personas zu modellieren, ist es möglich, die Situation in den Griff zu bekommen, indem man sich auf die Frage der Einführung von Datenkatalogen konzentriert. Hier gibt es zwei Nutzer , die hervorstechen:

  • Metadaten Produzenten die den Katalog mit Daten füttern und die Qualität des Inhalts überwachen - diese Gruppe wird allgemein als Data Stewards bezeichnet.
  • Metadaten Verbraucher die den Katalog nutzen, um ihre geschäftlichen Bedürfnisse kennenlernen - wir nennen sie Nutzer.

Diese beiden Gruppen sind natürlich nicht völlig unabhängig voneinander: Einige Data Stewards sind auch Benutzer.

Die Herausforderungen einer unternehmensweiten Katalogübernahme

Der eigentliche Wert eines Datenkatalog liegt in der breiten Akzeptanz durch eine große Zahl von (Meta-)Datenkonsumenten, nicht nur durch die Datenmanagement .

Der Pool der Datenkonsumenten ist sehr vielfältig. Er umfasst Datenexperten (Ingenieure, Architekten, Datenanalysten, Datenwissenschaftler usw.), Geschäftsleute (Projektmanager, Geschäftsbereichsleiter, Produktmanager usw.), Compliance- und Risikomanager. Und ganz allgemein werden wahrscheinlich alle Betriebsleiter Daten nutzen, um ihre Leistungen zu verbessern.

Die Übernahme des Datenkatalog durch die Nutzer wird häufig aus folgenden Gründen verlangsamt:

  • Die Nutzung des Datenkatalog ist sporadisch. Sie melden sich von Zeit zu Zeit an, um sehr spezifische Antworten auf bestimmte Anfragen zu erhalten. Sie haben selten die Zeit oder die Geduld, sich in ein Tool einzuarbeiten, das sie nur gelegentlich nutzen - es können Wochen vergehen, bis sie den Katalog nutzen.
  • Nicht jeder hat die gleiche Einstellung zu Metadaten. Einige konzentrieren sich mehr auf die technischen Metadaten, andere auf die semantischen Herausforderungen und wieder andere sind eher an den organisatorischen und Governance-Aspekten interessiert.
  • Nicht jeder wird das Metamodell oder die interne Organisation der Informationen innerhalb des Katalogs verstehen. Sie können sich schnell von einer Lawine von Konzepten abgeschreckt fühlen, die für ihre alltäglichen Bedürfnisse irrelevant erscheinen.

Der Smart Datenkatalog versucht, diese Hürden zu überwinden, um die Einführung von Katalogen zu beschleunigen. Hier wird gezeigt, wie die Actian Data Intelligence Platform diese Herausforderungen meistert.

Wie die Actian Data Intelligence Plattform die Katalogübernahme erleichtert

Die erste Lösung ist die grafische Schnittstelle. Die Lernkurve der Benutzer muss so kurz wie möglich sein. In der Tat sollte der Nutzer ohne jegliche Training sofort einsatzbereit sein. Um dies zu ermöglichen, haben wir eine Reihe von Entscheidungen getroffen.

Die erste Wahl war, zwei verschiedene Schnittstellen anzubieten, eine für die Datenverwalter und eine für die Benutzer:

Studio: Das Verwaltungs- und Überwachungswerkzeug für den Kataloginhalt - ein Expertenwerkzeug ausschließlich für die Data Stewards.

Erforscher: Für die Nutzer bietet es eine möglichst einfache Such- und Erkundungserfahrung.

Unser Ansatz orientiert sich an den Nutzer Prinzipien von Marktplatzlösungen - den anerkannten Spezialisten für Katalogmanagement (im allgemeinen Sinne). Diese Lösungen haben in der Regel zwei Anwendungen im Angebot. Die erste, eine "Backoffice"-Lösung, die es den Mitarbeitern des Marktplatzes (oder seiner Partner) ermöglicht, den Katalog auf möglichst automatisierte Weise zu füttern und seinen Inhalt zu kontrollieren, um seine Qualität zu gewährleisten. Die zweite Anwendung für die Verbraucher hat in der Regel die Form einer E-Commerce-Website und ermöglicht es den Endverbrauchern, Artikel zu finden oder den Katalog zu erkunden. Studio und Explorer spiegeln diese beiden Rollen wider.

Die Informationen sind nach der Rolle des Nutzer innerhalb der Organisation geordnet

Unsere zweite Möglichkeit befindet sich noch im Versuchsstadium und besteht darin, die Informationshierarchie im Katalog dynamisch an die Nutzer anzupassen.

Diese Herausforderung der Informationshierarchie ist es, die einen Datenkatalog von einem Marktplatz-Katalog unterscheidet. Die Informationshierarchie eines Datenkataloghängt in der Tat von der operativen Rolle des Nutzer ab. Für einige werden die wichtigsten Informationen in einem Datensatz technischer Natur sein: Standort, Sicherheit, Formate, Typen usw. Andere werden die Semantik der Daten und ihre geschäftliche Herkunft kennen müssen. Wieder andere wollen die Prozesse und Kontrollen kennen, die der Datenproduktion zugrunde liegen - aus Gründen der Compliance oder aus betrieblichen Erwägungen.

Der Intelligente Datenkatalog sollte in der Lage sein, die Struktur der Informationen dynamisch anzupassen, um sich den verschiedenen Prismen anzupassen. 

Die letzte verbleibende Herausforderung ist die Art und Weise, wie die Informationen im Katalog in Form von Erkundungspfaden nach Themen gegliedert sind (ähnlich wie die Regale auf einem Marktplatz). Es ist schwierig, eine Struktur zu finden, mit der alle einverstanden sind. Einige werden den Katalog nach technischen Gesichtspunkten erkunden (Systeme, Anwendungen, Technologien usw.). Andere werden den Katalog aus einer eher funktionalen Perspektive (Geschäftsbereiche) erkunden, wieder andere aus einem semantischen Blickwinkel (durch Geschäftsglossare usw.).

Die Herausforderung, dass sich alle auf eine einzige universelle Klassifizierung einigen müssen, scheint (uns) unüberwindbar. Der smarte Datenkatalog sollte anpassungsfähig sein und von den Nutzern nicht verlangen, eine Klassifikation zu verstehen, die für sie keinen Sinn ergibt. Letztlich ist die Nutzer einer der wichtigsten Erfolgsfaktoren für einen Datenkatalog.

Für weitere Informationen darüber, wie ein Intelligente Suchmaschine einen Datenkatalog aufwertet, laden Sie unser eBook herunter: "Was ist ein Smart Datenkatalog?".

actian avatar logo

Über Actian Corporation

Actian versetzt Unternehmen in die Lage, Daten in großem Umfang sicher zu verwalten und zu steuern. Die Data-Intelligence-Lösungen von Actian helfen beim Optimieren komplexer Datenumgebungen und einer beschleunigten Bereitstellung von KI-fähigen Daten. Actian-Lösungen sind flexibel, lassen sich nahtlos integrieren und arbeiten zuverlässig in On-Premises-, Cloud- und Hybrid-Umgebungen. Erfahren Sie mehr über Actian, die Datenabteilung von HCLSoftware, unter actian.com.