Was ist ein Knowledge Graph und wie verbessert er die Datenkataloge?
Actian Germany GmbH
4. November 2020

Wissensgraphen interagieren schon seit geraumer Zeit mit uns. Sei es durch personalisierte Einkaufserlebnisse über Online-Empfehlungen auf Websites wie Amazon, Zalando oder über unsere Lieblingssuchmaschine Google.
Dieses Konzept stellt jedoch für die meisten Daten- und Analysemanager immer noch eine Herausforderung dar, da sie Schwierigkeiten haben, ihre Unternehmensressourcen zusammenzufassen und zu verknüpfen, um sie so zu nutzen wie diese Web-Giganten.
Um diese Behauptung zu untermauern, stellt Gartner in seinem Artikel "How to Build Knowledge Graphs That Enable AI-Driven Enterprise Applications" fest, dass:
"Die Verantwortlichen für Daten und Analysen erleben einen zunehmenden Hype um Wissensgraphen, haben aber Schwierigkeiten, sinnvolle Anwendungsfälle zu finden, die die Akzeptanz im Unternehmen sichern".
In diesem Artikel definieren wir das Konzept eines Wissensgraphen, indem wir es am Beispiel von Google erläutern und aufzeigen, wie es einen Datenkatalog unterstützen kann.
Was genau ist ein Knowledge Graph?
Laut GitHub ist ein Wissensgraph eine Art von Ontologie die Wissen in Form von Entitäten und deren Beziehungen auf dynamische und data driven Weise darstellt. Im Gegensatz zu statischen Ontologien, die sehr schwer zu pflegen sind.
Hier finden Sie weitere Definitionen eines Wissensgraphen von verschiedenen Experten:
- Ein "Mittel zur Speicherung und Nutzung von Daten, das es Menschen und Maschinen ermöglicht, die Verbindungen in ihren Datensätzen besser zu nutzen." (Datanami)
- Eine "Datenbank, die Informationen in einem grafischen Format speichert - und, was besonders wichtig ist, eine grafische Darstellung der Beziehungen zwischen den Datenpunkten erzeugen kann. (Forbes)
- "Enzyklopädien der semantischen Welt". (Forbes)
Durch Algorithmen des Maschinelles Lernen , strukturiert es alle Ihre Daten und ermöglicht die Erstellung von multilateralen Beziehungen zwischen Ihren Datenquellen. Die Fluidität dieser Struktur wächst, wenn neue Daten eingeführt werden, so dass mehr Beziehungen erstellt und mehr Kontext hinzugefügt werden kann, was Ihren Datenteams hilft, informierte Entscheidungen mit Verbindungen zu treffen, die Sie vielleicht nie gefunden hätten.
Die Idee eines Wissensgraphen besteht darin, ein Netzwerk von Objekten aufzubauen und, was noch wichtiger ist, semantische oder funktionale Beziehungen zwischen den verschiedenen Objekten herzustellen.
Innerhalb eines Datenkatalog ist ein Wissensgraph also das, was verschiedene Konzepte repräsentiert und was Objekte durch semantische oder statische Links miteinander verbindet.
Google Beispiel:
Der Google-Algorithmus nutzt dieses System, um die für die Suchanfragen der Endnutzer relevanten Informationen zu sammeln und bereitzustellen.
Der Wissensgraph von Google enthält mehr als 500 Millionen Objekte sowie mehr als 3,5 Milliarden Fakten über und Beziehungen zwischen diesen verschiedenen Objekten.
Ihr Knowledge Graph verbessert die Google-Suche in dreierlei Hinsicht:
- Finden Sie das Richtige: Suchen Sie nicht nur nach Schlüsselwörtern, sondern auch nach deren Bedeutung.
- Erhalten Sie die beste Zusammenfassung: Sammeln Sie je nach Absicht die wichtigsten Informationen aus verschiedenen Quellen.
- Gehen Sie tiefer und breiter: Entdecken Sie mehr, als Sie erwartet haben, dank der relevanten Vorschläge.
Wie können Wissensgraphen die Nutzung von Datenkatalog unterstützen?
Angetrieben durch einen Datenkatalog, können Wissensgraphen Ihrem Unternehmen Nutzen in ihrer Datenstrategie durch:
Reichhaltige und tiefgehende Suchergebnisse
Viele Suchmaschinen verwenden heute mehrere Wissensgraphen, um über die einfache schlagwortbasierte Suche hinauszugehen. Wissensgraphen ermöglichen es diesen Suchmaschinen, Konzepte, Entitäten und die Beziehungen zwischen ihnen zu verstehen. Zu den Vorteilen gehören:
- Die Fähigkeit, tiefergehende und relevantere Ergebnisse zu liefern, einschließlich Fakten und Beziehungen, anstatt nur Dokumente.
- Die Fähigkeit, Suchanfragen in Form von Fragen oder Sätzen zu formulieren - und nicht in Form einer Liste von Wörtern.
- Die Fähigkeit, komplexe Suchvorgänge zu verstehen, die sich auf Wissen beziehen, das in mehreren Elementen gefunden wurde, indem die im Diagramm definierten Beziehungen genutzt werden.
Optimierte Daten-Discovery
Unternehmensdaten bewegen sich in Lichtgeschwindigkeit von einem Ort zum anderen und werden in verschiedenen Datenquellen und Speicheranwendungen gespeichert. Mitarbeiter und Partner greifen von überall und jederzeit auf diese Daten zu, so dass Die Identifizierung, Lokalisierung und Klassifizierung Ihrer Daten, um sie zu schützen und Erkenntnisse aus ihnen zu gewinnen, sollte daher Priorität haben.
Die Vorteile von Wissensgraphen für Daten-Discovery umfassen:
- Ein besseres Verständnis der Unternehmensdaten, wo sie sich befinden, wer und wo auf sie zugreifen kann und wie sie übermittelt werden.
- Automatische Datenklassifizierung auf der Grundlage des Kontexts.
- Risikomanagement und Einhaltung von Vorschriften.
- Vollständige Datentransparenz.
- Identifizierung, Klassifizierung und Verfolgung von sensiblen Daten.
- Die Möglichkeit, auf der Grundlage vordefinierter Richtlinien und kontextbezogener Faktoren Schutzkontrollen auf Daten in Echtzeit anzuwenden.
- Eine angemessene Bewertung der gesamten Datenlage.
Einerseits hilft sie bei der Umsetzung geeigneter Sicherheitsmaßnahmen, um den Verlust sensibler Daten zu verhindern und verheerende finanzielle und rufschädigende Folgen für das Unternehmen zu vermeiden. Andererseits ermöglicht es den Teams, tiefer in den Datenkontext einzudringen, um die spezifischen Elemente zu identifizieren, die die Antworten offenbaren, und Wege zur Beantwortung Ihrer Fragen zu finden.
Intelligente Empfehlungen
Wie in der Einleitung erwähnt, sind Empfehlungsdienste heute ein vertrauter Bestandteil vieler Online-Shops, persönlicher Assistenten und digitaler Plattformen.
Die Empfehlungen müssen einen inhaltsbasierten Ansatz verfolgen. Innerhalb eines Datenkatalog können Maschinelles Lernen Funktionen in Kombination mit einem Wissensgraphen bestimmte Datentypen erkennen, Tags oder statistische Regeln auf Daten anwenden, um effektive und intelligente Asset-Vorschläge zu erstellen.
Diese Fähigkeit wird auch als Datenmustererkennung bezeichnet. Sie bezieht sich auf die Fähigkeit, ähnliche Werte zu identifizieren und sich auf statistische Algorithmen und Funktionen zu stützen, die von anderen Mustererkennungssystemen abgeleitet sind.
Dieses System zur Erkennung von Datenmustern hilft Datenverwaltern bei der ihr Metadaten :
- Identifizieren von Duplikaten und Kopieren von Metadaten
- Erkennung logischer Datentypen (E-Mails, Städte, Adressen usw.)
- Vorschlagen von Attributwerten (Erkennen von Dokumentationsmustern, die auf ein ähnliches oder ein neues Objekt anzuwenden sind)
- Links vorschlagen - semantische oder Abstammungslinks
- Erkennen potenzieller Fehler, um die Qualität und Relevanz des Katalogs zu verbessern
Die Idee ist, einige Techniken zu verwenden, die von inhaltsbasierten Empfehlungen abgeleitet sind, die in allgemeinen Katalogen zu finden sind. Wenn der Nutzer etwas gefunden hat, schlägt der Katalog Alternativen vor, die sowohl auf dem Profil des Nutzers als auch auf der Mustererkennung basieren.
Einige Datenkatalog , die durch Wissensgraphen unterstützt werden
- Sammeln von Daten, die verwendet wurden oder mit Fehlerursachen in Zusammenhang stehen in digitalen Projekten.
- Suche nach Aktiva mit besonderen Interessen die auf neue Produkte für die Marketing-Abteilung abgestimmt sind.
- Erzeugen von vollständige 360°-Ansichten von Personen und Unternehmen in der Vertriebsabteilung.
- Abstimmung des Unternehmensbedarfs auf Menschen und Projekte für HRs.
- Fundstelle Vorschriften für bestimmte Verträge und Investitionen Vermögenswerte in der Finanzabteilung.
Schlussfolgerung
Bei der unaufhörlichen Zunahme von Daten in Unternehmen bedeutet die Organisation Ihrer Informationen ohne eine Strategie, dass Sie nicht in der Lage sind, im digitalen Zeitalter wettbewerbsfähig und relevant zu bleiben. Um den gefürchteten "Black Box"-Effekt zu vermeiden, ist es wichtig, dass Ihr Datenkatalog über einen unternehmensweiten Knowledge Graph verfügt.
Durch einen Wissensgraphen in Kombination mit KI und Algorithmen des Maschinelles Lernen erhalten Ihre Daten mehr Kontext und ermöglichen es Ihnen nicht nur, tiefere und subtilere Muster zu entdecken, sondern auch intelligentere Entscheidungen zu treffen.
Für weitere Einblicke, was ein Wissensgraph ist, gibt es hier einen großartigen Artikel von BARC Analyst Timm Grosser "Linked Data for Analytics?".
Starten Sie IhreMigration
Actian Data Intelligence Platform ist eine 100% Cloud Lösung, die mit wenigen Klicks überall auf der Welt verfügbar ist. Wenn Sie sich für die Actian Data Intelligence Platform Datenkatalog entscheiden, kontrollieren Sie die Kosten, die mit der Implementierung und Pflege eines Datenkatalog verbunden sind und vereinfachen gleichzeitig den Zugang für Ihre Teams.
Die automatischen Zuführungsmechanismen, sowie die Vorschlags- und Korrekturalgorithmen, reduzieren die Gesamtkosten eines Katalogs, und garantieren Ihren Datenteams mit Qualitätsinformationen in Aufzeichnung .
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden: Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.