Data Intelligence

Webinar – Daten, erforscht #3 – Grundlagen des Metadaten

November 10, 2025

53:26

Zusammenfassung

Bespricht Oles Buch über Datenmanagement, Logistik und IT-Landschaften.
Untersucht Metadaten , das Meta-Grid-Konzept und die Auswirkungen der KI.
Betont die Nutzung vorhandener Datenbestände, insbesondere in Start-ups.
Forderungen nach einem fortgesetzten Dialog der Branche über Metadaten

Kapitel

00:00Einführung

00:14Start der Veranstaltung

Ich werde ein wenig über die Logistik sprechen und darüber, warum wir hier sind. Wir sind hier, um über die Grundlagen Datenmanagement zu sprechen, und wir werden ein „Fragen Sie mich alles”-Format zu allen Themen rund um Metadaten anbieten, Metadaten interessieren. Bevor wir beginnen, möchte ich mich und Ole kurz vorstellen. Ole und ich haben uns kennengelernt, als ich sein erstes Buch über Datenkatalog in Unternehmen gelesen habe.

Seitdem stehen wir in Kontakt. Wir haben uns an verschiedenen Orten getroffen, und ich habe den Eindruck, dass Ole Ha eine tiefgründige, führende Denkweise in Bezug auf Metadaten hat. Deshalb freue ich mich sehr darauf, dass er über sein neues Buch spricht.

Äh, heute bin ich selbst seit etwa 17 Jahren im Öl- und Gassektor tätig und beschäftige mich mit Data Analytics Softwareentwicklung. Derzeit bin ich bei Databricks tätig und ermögliche unseren verschiedenen Kunden, die Plattform effektiv zu nutzen. Damit sind alle Fragen und Antworten in Bezug auf die Logistik geklärt.

Bitte posten Sie diese in den Fragen und Antworten in Ihrem Zoom, damit wir sie sehen und priorisieren können. Für unsere heutige Sitzung können Sie natürlich den Zoom-Chat für alle Gespräche nutzen, die Sie führen müssen. Sie können in dieser Sitzung nicht die Audiofunktion nutzen. Nur ich werde sprechen.

Aber alle Ihre Fragen und Kommentare sind im Chat und im Frage-Antwort-Bereich willkommen, äh, in angemessener Form. Ähm, nachdem das gesagt ist, denke ich, können wir loslegen. Ähm, also Ali, äh, bevor wir anfangen, gibt es etwas, das Sie heute dem Publikum sagen möchten?

Vielen Dank an alle fürs Erscheinen. Ich denke, es ist noch so früh, dass sich in den nächsten Minuten noch weitere Personen einloggen werden. Ähm, aber, äh, ich danke allen fürs Erscheinen und fürs stetige Erscheinen.

Und auch Abbe, danke, dass du das machen wolltest. Normalerweise interviewe ich Leute in dieser Webinar-Reihe, also haben wir die Mikrofone umgedreht, weil du dich gemeldet hast und viele Fragen auf LinkedIn hattest, und du bist nicht die Einzige. Und dann habe ich schließlich beschlossen: Warum nicht?

Äh, warum machen wir nicht einfach ein „Fragen Sie mich alles”-Format? Und Sie waren dafür zu haben. Und deshalb danke ich Ihnen, äh, AB, dass Sie sich die Zeit genommen haben, äh, dieses Webinar zu moderieren.

Nein, nein, ich bin wirklich begeistert davon. Weißt du, ich meine, das ist ein großartiges Buch. Ich kann mich nicht erinnern, Metadaten letzter Zeit ein Buch gesehen zu haben, das sich auf Metadaten konzentriert.

Vielen Dank, dass Sie sich die Zeit genommen haben, das Buch zu schreiben und Meta Grid der Welt vorzustellen. Ich meine, es ist ein Thema, mit dem sich viele Menschen beschäftigen und versuchen zu verstehen: Was ist Meta Grid? Wie können wir es nutzen?

02:50Meta Grid und IT

Also, ich denke, wir können mit dem Meta-Grid anfangen. Äh, was, was siehst du, äh, ist der Wert des Meta-Grids, wenn die Leute das Meta-Grid verstehen und versuchen, es in ihrer Umgebung einzusetzen? Wie läuft das deiner Meinung nach, Ali?

Als ich das Buch schrieb, haben sich tatsächlich viele Leute bei mir gemeldet und gesagt, dass sie genau das in ihrem Unternehmen machen. Und ich glaube, ich kann einen Mann namens Craig Bob nennen, der sich von UBS gemeldet hat und gesagt hat, dass er diese Art von Architektur aufbaut. Viele andere haben sich auch gemeldet, mussten aber relativ diskret bleiben.

Äh, ich konnte sie also nicht zitieren. Aber im Grunde genommen ist die Re-Architektur, die ich in meinem Buch beschrieben habe, eine Architektur. Es handelt sich um eine sehr kleine, langsame und einfache Architektur, um Metadaten aus verschiedenen Metadaten-Repositorien zu vereinen oder, besser gesagt, zu koordinieren.

Es ist also eigentlich das, man könnte sagen, komplizierteste Thema des Buches, ähm, denn ich spreche in dem Buch Metadaten über Metadaten , ähm, aber es ist auch ein Versuch, eine Antwort in einem Universum zu liefern, das sehr stark durch das Fehlen offener Standards und die Komplexität großer IT-Landschaften mit vielen technischen Schulden, vielen politischen Diskussionen oder, ähm, wie, ähm, Tendenzen in Organisationen und viel Unsicherheit darüber, was Metadaten im Allgemeinen Metadaten , definiert ist. Ich wollte den Leser also nicht ohne eine Antwort zurücklassen, ohne eine Perspektive, wie die von mir angesprochenen Probleme gelöst werden können, und das ist die bessere Antwort. Fantastisch.

Vielen Dank. Und diejenigen, die in den letzten Minuten zugeschaltet haben, können ihre Fragen gerne im Q&A-Bereich in Zoom stellen. Wir fangen gerade erst an.

Ähm, ich sehe gerade keine Fragen. Äh, also fangen wir einfach mit einer Frage an. Ich habe über das Meta-Grid gesprochen.

Was hat Sie dazu motiviert, das Buch zu schreiben, und zwar so detailliert, wie Sie es getan haben? Ich denke, das ist auch eine wichtige Frage. Äh, der Schreibprozess selbst, wissen Sie, die Art und Weise, wie man über technische Themen schreibt, verändert sich, und, wissen Sie, das Buchformat ist gesättigt.

Äh, können Sie uns etwas über den Prozess selbst erzählen? Wie haben Sie zu diesem Thema recherchiert? Warum hielten Sie es für wichtig, konsistent über das Metagrid zu sprechen?

Richtig? Ja, klar, klar. Danke.

Danke, Abbe. Ich denke, ähm, also, es ist wirklich so, dass mich dieses Buch schon seit langer Zeit beschäftigt, weil ich in großen, äh, Branchen in vielen verschiedenen Bereichen gearbeitet habe, äh, aber insbesondere in regulierten Branchen und in der Pharmaindustrie. Ähm, und im Laufe meiner Karriere habe ich immer wieder festgestellt, dass es ein Mangel an Verständnis für die IT-Landschaft gibt, also ein grundlegendes Unverständnis für die IT-Landschaft in einem Unternehmen. Klassische Fragen: Wie viele Anwendungen haben wir?

Wie sind sie integriert? Welche Arten von Daten betreffen sie? In welchem Umfang handelt es sich um diese Daten?

PII wie personenbezogene Daten. Inwieweit sind diese vertraulich? Ähm, vertraulich.

Ähm, wie sieht die Realität unserer physischen Infrastruktur aus, wo befinden sich unsere Server? Wie heißen sie? Wem gehören sie?

Alle Elemente der IT-Landschaft eines Unternehmens sind extrem undurchsichtig. In meinem ersten Buch habe ich den Datenkatalog äußerst effektive Lösung untersucht, um die Daten in der IT-Landschaft eines Unternehmens sichtbar zu machen, richtig? Ich glaube fest an Datenkataloge, ich glaube im Wesentlichen fest an alle Technologien, die wir für verschiedene Arten von Aufgaben in Unternehmen einsetzen.

Aber ich habe gesehen, dass viele dieser Technologien isoliert voneinander implementiert werden. Das habe ich als Unternehmensarchitekt und als Datenverantwortlicher in vielen verschiedenen Unternehmen beobachtet. Ich bin mir ziemlich sicher, dass dies in jedem großen Unternehmen einer bestimmten Größe, also in Industrieunternehmen, der Fall ist, oder?

Und deshalb wollte ich ein Buch zu diesem Thema schreiben. Und das ist kompliziert, weil es um die Realität geht. Es geht also nicht um ideale Architekturen, es geht nicht um Programmiersprachen und Greenfield, äh, Designideen.

Es geht um die Realität. Und die Realität ist etwas anderes, nicht wahr? Also, also, also, das ist das Buch, äh, in seiner, äh, Kernessenz.

Es ist ein Buch über die verschiedenen Arten von Technologien, die wir für Datenmanagement einsetzen. Und davon gibt es ziemlich viele, und daraus ergeben sich eine Menge Probleme. Ich wurde kürzlich tatsächlich von jemandem gefragt, der ziemlich klug ist.

Wenn ich, wenn ich, wenn ich mein Buch in einem Satz beschreiben müsste, wie würde dieser lauten? Und ich denke, meine Antwort darauf lautet: Unternehmen haben in der Regel mehr als einen Datenkatalog. Richtig.

Wenn Sie also über diese Antwort nachdenken, können Sie sich fragen: Was repräsentieren Sie in einem Datenkatalog? Was repräsentieren Sie in einem anderen? Und wie hängen diese Technologien zusammen?

Und wenn man das erweitert und sagt: Okay, aber wir haben auch Konfigurationsmanagement-Datenbanken und Asset-Management-Systeme und Lernmanagementsysteme und Informationssicherheits-Managementsysteme, also viele verschiedene Technologien, die eigentlich keine Funktion in der Wertschöpfungskette haben, sondern nur die gesamte IT-Infrastruktur überwachen, die die Wertschöpfungskette ausführt. Sie erfassen lediglich die Daten. Und wie hängt das zusammen?

Darum geht es in diesem Buch. Fantastisch. So habe ich das Buch verstanden.

Ich denke mir: Okay, da sind all diese Kataloge. Aber wie sollen wir sie verstehen? Richtig?

Ähm, ja.

09:20Datenkataloge und KI

Aber wenn wir über Datenkataloge sprechen, gibt es meiner Meinung nach eine interessante Entwicklung, die wir aufgrund der KI beobachten können, und ich weiß, dass wir jetzt direkt zur KI übergehen, aber ich halte das für eine wichtige Frage, nämlich die Rolle von Katalogen in der KI. Früher hat man den Katalog organisiert, man hat versucht, einen zentralisierten Unternehmenskatalog zu haben, und man hatte all diese verschiedenen Kataloge an verschiedenen Orten. Wie Sie bereits erwähnt haben, gibt es so viele verschiedene Bereiche wie Asset Management, Sicherheit, Lernmanagementsysteme und so weiter, nicht wahr?

Ähm, also, mit den Fortschritten in der KI, wo, wie Sie wissen, die Konversationsschnittstellen immer Nutzer werden, würde Nutzer sagen. Sehen Sie, dass die Rolle dieser Kataloge noch wichtiger wird? Oder wie sehen Sie diesen Übergang oder diese Veränderung in Bezug darauf, wie Menschen mit Katalogen interagieren?

Richtig. Oh ja. Gute Frage.

Also, ich denke, und ich gehe darauf in meinem Buch ein, aber es geht auch ein wenig über den Rahmen des Buches hinaus. Aber, äh, das macht nichts, denn ich gehe auch in meinem Buch ein wenig darauf ein. Also, die Art und Weise, wie ich die Interaktion der Menschen mit Katalogen im Zeitalter der KI sehe, hat sich tatsächlich ziemlich stark verändert.

Ähm, äh, aus zwei Gründen. Was wir in Datenkatalogen tun, wird wie in jedem anderenLager durch KI ergänzt. Viele Dinge, die im Datenkatalog vor sich gehen, Datenkatalog also durch KI ergänzt, werden bereits durch KI ergänzt.

Und das ist eine heikle, äh, Entwicklung. Denn manche Dinge können durch KI verbessert oder erweitert werden, andere hingegen nicht. Äh, wir sprechen hier einfach über die Gesetze der Semantik.

Bestimmte Dinge werden verbessert werden können, andere hingegen nicht. Das ist also definitiv etwas, das sich mit KI verändert. Es geht um das Verhalten, um die tatsächliche Leistung des Datenmanagement diesem Fall eines Datenkatalog.

Aber andererseits denke ich, dass Datenkataloge auch selbst zu Quellen werden, was eine völlig neue Entwicklung ist, eine Veränderung in der Art und Weise, wie Metadaten werden. Anstatt also einfach nur viele Quellen zu registrieren, wie ich Metadaten in meinem Buch Metadaten Kernelement der Definition von Metadaten dargelegt habe, befinden sie sich an zwei Orten gleichzeitig, damit sie ihren Zweck erfüllen können. Denken Sie zum Beispiel an Amazon oder einen anderen Online-Buchladen, richtig?

Sie suchen in diesem Online-Buchladen und finden ein Buch. Nun, die Metadaten, die Metadaten das, was das Objekt, das Sie in diesem Online-Buchladen finden, und das Objekt selbst miteinander verbindet. Das kann also der Titel sein, es kann der Verlag sein, es kann der Autor sein.

All das sind Metadaten, und sie befinden sich im Wesentlichen an zwei Orten gleichzeitig, richtig? Das ist also die traditionelle Rolle von Metadaten. Sie müssen an zwei Orten gleichzeitig sein, damit wir die Dinge selbst entdecken, finden, nutzen, verwalten steuern können, sei es Server, Datensätze, Computer oder was auch immer.

Ähm, aber mit der Einführung von KI sehen wir auch, dass Metadaten , insbesondere Ontologien, selbst zu sehr, sehr wertvollen Quellen werden. So wie der gesamte Aufstieg von Modellkontext, Protokoll und Agent-zu-Agent-Protokoll etwas ist, das wirklich die neue Rolle von Metadaten als Quelle belegt. Und das beschreibe ich in meinem Buch, am Ende meines Buches, indem ich die Meta-Grid-Architektur als Quelle für KI verwende.

Oh, das ist fantastisch. Ich denke, ja, es ist, äh, es ist eines dieser, äh, Dinge, die gerade im Entstehen sind. Und es wäre interessant zu sehen, wie sich das entwickelt, denn der Grund, warum ich diese Frage gestellt habe, war eigentlich, dass die verwendete Semantik früher nah an den Geschäftsanwendern war, richtig?

Mm-hmm. Ich habe darüber nachgedacht, ob Semantik jetzt in der Nähe des Katalogs angesiedelt sein sollte, richtig? Denn mm-hmm.

Wissen Sie, wenn Menschen ihre eigene Semantik haben, die nah an der Grenze liegt oder nah an dem Ort, an dem sie diese Daten verwenden, wo ist es dann am sinnvollsten, diese Daten zu haben? Richtig? Was sind Ihre Ansichten dazu?

Wo sollte die Semantik angesiedelt sein? Zum Beispiel in der Business Intelligence, in Visualisierungstools oder in der Nähe des Katalogs, richtig? Oder vielleicht in einem zentralisierten Katalog, falls es einen gibt oder falls man versucht, einen zentralisierten Katalog zu erstellen.

Hast du darüber nachgedacht? Gibt es Ja. Ja.

Ich denke, ich denke, ich denke, es gibt kein Richtig oder Falsch in dem, was Sie sagen. Ich möchte das ein wenig umdrehen, in dem Sinne, dass ich denke, dass ein Maßstab für den Erfolg sein sollte, dass Ihre Geschäftsanwender, Ihre Endanwender, einen Datenkatalog nicht Datenkatalog etwas betrachten, das weit entfernt von den Geschäftsanwendern ist, richtig? Ich denke, ich denke, die Semantik ist sehr nah an jedem einzelnen Mitarbeiter, Endnutzer, wenn Sie so wollen, dass sie in einem Katalog enthalten sein sollte, der nicht weit entfernt von einem Katalog oder einem anderenLager sein sollte.

Das ist also mein Ideal. Aber im Grunde genommen glaube ich, dass es keine einheitliche Lösung oder eine bestimmte Konfiguration geben kann. Ich denke, Metadaten es in vielen verschiedenen Lösungen, vielen verschiedenen Speicherlösungen und Technologien geben, und das wird wohl auch so bleiben.

So verhält sich Metadaten nun einmal. Ja. Wir haben ein paar Fragen in den Fragen und Antworten.

Lassen Sie mich die erste Frage hier beantworten. Eine der Fragen lautet: Ist ein serialisiertes KI-Modell davon abhängig? Oder gibt es eine Architektur, die ausschließlich für ein serialisiertes Modell gilt?

Ich denke, ich verstehe diese Frage so, dass wir wahrscheinlich noch etwas mehr Klarheit zu dieser Frage benötigen, aber die erste Frage lautet: Wie wichtig ist der Datenkatalog die Übernahme des Datenmodells der Branche für das KI-Modell? Ich denke, das ist eine relevante Frage, eine wichtige Frage, oder? Welche Rolle spielt der Datenkatalog bei der Einführung von KI und wie wichtig ist er?

Richtig? Ja, ich denke, es ist super wichtig, dass Ihr Datenkatalog richtig aufgebaut Datenkatalog . Und ich möchte jetzt Folgendes sagen: Ich weiß, dass wir, ähm, sozusagen der Chef der Aktionisten in Aktion sind, und ich glaube fest an unsere Technologie, ähm, aber ich möchte dennoch etwas sagen, das meiner Meinung nach nicht technologieunabhängig ist, denn ich glaube, dass die Tage der nicht, äh, wissensbasierten Power-Datenkataloge vorbei sind, zumindest wenn man den Ehrgeiz hat, ein Unternehmenskatalog zu sein, der für das gesamte Unternehmen gedacht ist. Ich denke, die Tage dieser Kataloge, die nicht auf Wissensgraphen basieren, sind vorbei.

Und ich sehe KI als ein sehr, sehr starkes Zeichen dafür. Zurück zur Frage, deshalb habe ich das erwähnt. Bei der Einführung von KI spielen Datenkataloge eine große Rolle, einfach weil sie auf einem Wissensgraphen aufgebaut werden können und dieser Wissensgraph in der Lage ist, Kontext für KI-Anwendungsfälle für viele verschiedene Arten von KI-Anwendungsfällen bereitzustellen.

Zum Beispiel, äh, Data Analytics, ähm, Wissensgraphen sind in der Lage, sehr wertvolle Kontexte zu liefern, sodass Sie die KI verbessern können, äh, durchgeführt, äh, Data Analytics, äh, mit einem Hauch von, äh, menschlicher Intelligenz, beweisen Sie den Graphen. Also ich denke, ich denke, um die Frage einfach zu beantworten, ich denke, dass Datenkataloge eine große Rolle bei der Einführung von KI spielen, ganz ehrlich. Okay.

So wie ich das verstanden habe, sprechen Sie von Katalogen, die auf einem Wissensgraphen basieren oder die für die Funktionsweise von KI in einer bestimmten Weise von entscheidender Bedeutung sind. Ist das eine gute Zusammenfassung dessen, was Sie in Bezug auf den Wissensgraphen meinen? Ja, sicher.

Das ist ein sehr beliebtes Muster, nicht wahr? Der Wissensgraph, äh, plus, äh, große Sprachmodelle, äh, ist etwas, das super interessant ist, äh, weil, sagen wir, das große Sprachmodell der Text ist und der, äh, Wissensgraph der Kontext, also, richtig. Äh, also, das ist eine sehr schöne, äh, schöne Art, äh, Technologien zu kombinieren, um, äh, bessere Ergebnisse für KI zu erzielen.

Und zufälligerweise basieren diese Datenkataloge entweder auf Wissensgraphen, sind mit ihnen verbunden oder werden durch sie erweitert. Und dieser Kontext der Wissensgraphen ist für KI-Anwendungsfälle wirklich sehr wertvoll. Fantastisch.

Ähm, die zweite Frage, äh, ich denke, sobald ich mir darüber im Klaren bin, werde ich sie stellen. Äh, aber lassen Sie uns zu den Grundlagen kommen. Wissen Sie, in Ihrem Buch geht es um Grundlagen.

Wie definieren Sie Metadaten in Ihrer Weltanschauung? Was sind die Kriterien, nach denen Sie etwas als Metadaten bezeichnen? Wie denken Sie darüber?

Also, okay, das sind Metadaten, richtig? Denn die Sache ist die: Man könnte die Uni of Metadaten nennen, man könnte den Vektor, der einige Metadaten einbettet, so nennen. Ich meine, es gibt so viele Dinge, die als Metadaten gekennzeichnet werden könnten.

Deshalb war ich sehr daran interessiert, mehr über Ihren Denkprozess zu erfahren. Wie können wir sagen, dass es sich hierbei wirklich um Metadaten handelt, Metadaten wie definieren wir diese anhand use case? Wie gehen wir die Definition von Metadaten einem Unternehmen und in einer Unternehmensumgebung oder für use case an, je nachdem, wie man es betrachtet?

Ja. Danke für diese Frage, Avi. Ich denke, ich denke, dass, also, um anzufangen, und ich habe mich in letzter Zeit mit der Datenmanagement beschäftigt.

Also, warum nicht, warum mache ich nicht weiter? Äh, ich denke, die Art und Weise, wie Metadaten in Datenmanagement traditionellen Datenmanagement und zur Datenverarbeitung definiert Metadaten , gibt es zwar ein paar Ausnahmen, aber in vielen Werken finde ich leider Definitionen von Metadaten einfach nur Listen von Unterkategorien von Metadaten sind. So würden beispielsweise die typischen, äh, äh, Arten von Unterkategorien als technische Metadaten, operative Metadaten und Geschäftsmetadaten aufgeführt werden.

Und diese Erklärungen, die man in vielen Büchern findet, besagen, dass Metadaten verschiedene Arten Metadaten , nämlich technische, operative und geschäftliche. An diesen Aufzählungen ist eigentlich nichts auszusetzen. Aber philosophisch gesehen – und ich weiß, dass dies im technologischen Kontext ein gefährliches Wort ist – aber philosophisch gesehen, ja.

Ähm, philosophisch gesehen kann man nichts wirklich definieren, indem man nur Unterkategorien auflistet. Das ist keine Definition, das ist nur eine Liste von Unterkategorien. Man erfasst damit nicht das Wesentliche dessen, worüber man spricht.

Um nun auf Ihre Fragen zurückzukommen: Könnte nicht alles wie ein Vektor sein? Warum ist das kein Metadaten? Nun, das kann es natürlich sein, denn die Kerndefinition von Metadaten, wie ich sie verstehe, basiert auf jahrhundertelanger Bibliothekswissenschaft und Bibliothekspraxis, die Teil meiner Ausbildung sind.

Ich habe so etwas wie einen akademischen Hintergrund in diesem Bereich. Ähm, Metadaten um etwas, Metadaten sind Metadaten an zwei Orten gleichzeitig. Das ist die Definition von Metadaten, was bedeutet, dass nicht das, was sie sind, sondern wo sie sind, Metadaten charakterisiert.

Metadaten alles Mögliche sein. Sie können operativer Natur sein, sie können technischer Natur sein, sie können geschäftlicher Natur sein, sie können vieles andere sein, sie können social media sein, äh, Metadaten. Man kann also jede beliebige Unterkategorie auflisten.

Das ist nicht das Wesentliche von Metadaten. Es geht darum, wo sie sich befinden, und dass sie an zwei Orten gleichzeitig sind. Das ist das Charakteristische an Metadaten.

Es muss an zwei Orten gleichzeitig sein. Also ja, eine Vektoreinbettung, warum nicht das irgendwo auflisten, um diese Vektoreinbettung zu finden, dann wird es zu Meet-Daten. Okay.

Und es gibt da eine grundlegende Frage. Ich möchte mich nicht in philosophische Diskussionen verstricken, aber Unternehmen wollen Daten, denen sie vertrauen können. Ich denke, darüber sollten wir sprechen. Und Daten, denen manchmal vertraut wird, wissen Sie, die Leute sprechen in Bezug auf Vertrauen davon, dass dies die Daten sind, denen wir vertrauen können, richtig?

Also, äh, was Ihre Definition von Metadaten angeht, wie viele Ebenen und wie viel Herkunftsnachweis brauchen wir, und wie können wir einen Herkunftsnachweis erstellen, der bisher nicht existierte, um zu einer Definition von vertrauenswürdigen Daten zu gelangen? Wie sollten wir das in Unternehmen angehen, in denen Metadaten bisher keine Priorität hatte? Wie sollen wir jetzt darüber denken und das direkt angehen?

Richtig? Ich denke, ich denke, ich denke, dass wir Zeugen von etwas ziemlich Bedeutendem sind. Ich denke, wir erleben eine erhebliche Verschiebung in der Priorisierung von strategischen Initiativen und Unternehmen, die von datenwissenschaftlichen Ambitionen mit strukturierten Daten zu KI-Ambitionen auf der Grundlage unstrukturierter Daten übergehen.

Mm-hmm. Und ich denke, viele Studien belegen das, und sie sagen viele verschiedene Dinge. Diese Studien, zum Beispiel die MIT-Studie, haben kürzlich aufgelistet, dass 95 % aller KI-Projekte keine Rolle spielen, wie Sie die Details dieser Studie diskutieren können.

Ist es überhaupt fair, diese Analyse zum jetzigen Zeitpunkt durchzuführen? Sind die Messgrößen richtig? Ähm, ich denke, dass die Kritiker einige sehr gute Argumente in Bezug auf die Messgrößen in dieser Studie vorbringen, aber die Studie selbst beweist, dass sich das strategische Interesse, wie beispielsweise die Gespräche auf Führungsebene in Unternehmen, grundlegend in Richtung KI verändert hat.

Das steht außer Frage. Wie jedes Unternehmen auf der Welt mit ein wenig Ehrgeiz möchte auch es seine KI-Agenda vorantreiben. Was ist dafür erforderlich?

Nun, plötzlich braucht man nicht nur strukturierte Daten, sondern auch unstrukturierte Daten, richtig? Richtig. Also beim Aufbauen und, und diese unstrukturierten Daten sind im Format von, äh, Text von, äh, Bildern von, äh, allem, bei dem Victor Embeddings hilft, richtig?

Apropos, richtig? Und deshalb denke ich, dass Metadaten diesem Zusammenhang plötzlich Teil dieser sehr, sehr strategischen Gespräche auf Meereshöhe sind. Es ist nicht etwas, das Ingenieure oder Compliance-Mitarbeiter vorantreiben wollen.

Es ist tatsächlich ein sehr wichtiger Bestandteil, um mit KI erfolgreich zu sein, weil es so viel Kontext liefern kann, weil es diese Erhöhung der Präzision liefern kann, die zu einer besseren Leistung der KI führt. Und ich denke, dass immer mehr Führungskräfte das zu verstehen beginnen. Und ich denke, dass Datenmanagement traditionelle Datenmanagement sich Datenmanagement in einer gewissen Herausforderung befindet.

Wenn Sie beispielsweise im traditionellen Bereich tätig sind, wenn Sie als traditioneller Dateningenieur Pipelines für etabliertere Data Analytics aufgebaut haben, dann denke ich, dass sich die strategische Finanzierung in Ihrem Unternehmen bald ändern wird und Sie sich an diese Situation anpassen sollten. Und ich denke, das ist etwas, das die Daten-Community in diesen Jahren wirklich verändert, dass sich die Hierarchie zwischen strukturierten und unstrukturierten Daten verändert. Die Rolle von Metadaten wandelt sich zu etwas anderem.

Es wird Teil der Diskussionen in der Führungsetage, äh, wegen KI und vielen eher traditionellen wissenschaftlichen, äh, Maschinelles Lernen , die alle wirklich cool sind. Ich habe absolut nichts gegen diese Disziplinen, aber sie müssen sich einer anderen Art von Diskussion stellen, um in die Gespräche der Führungsetage zu gelangen. So sehe ich die Veränderung, und ich baue Vertrauen in Daten auf.

Also, ich denke, es sind dieselben Dinge wie zuvor, oder? Wenn du von strukturierten Daten sprichst, dann im Wesentlichen schon, oder? Ja.

Meine Frage war eher, wissen Sie, offensichtlich ist das wie ein ständiger Kampf, wissen Sie, Vertrauen in Daten aufzubauen, richtig? Und natürlich spielen Metadaten Herkunft eine große Rolle. Also, ähm, wie Sie sagten, wissen Sie, wenn wir KI mit dem konfrontieren, wissen Sie, können wir den Antworten der KI nicht vertrauen, also müssen wir sie auf Herkunft und Metadaten Wissensgraphen stützen, wissen Sie, Ontologien, die Sie erwähnt haben.

Richtig? Das sind also die Dinge, an denen die Leute meiner Meinung nach arbeiten. Äh, wir haben noch weitere Fragen zu serialisierten KI-Modellen.

Mein Verständnis von serialisierten KI-Modellen ist, dass es sich um Modelle handelt, die wir speichern und bei Bedarf wieder abrufen können. Die Frage lautet eigentlich: Gibt es eine empfohlene Metadaten , die die Deployment den Lebenszyklus eines serialisierten KI-Modells unterstützt? Ähm, nun, ich wiederhole mich hier vielleicht, aber ich würde sagen, dass die Verwendung des Modellkontextprotokolls, um Wissensgraphen für eine höhere Präzision zu nutzen, wirklich empfehlenswert ist.

Äh, und damit meine ich, dass man sich Technologien anschauen sollte, die das ermöglichen, Konnektor einen MCP-Server oder einen Konnektor haben, Konnektor ihre Daten auf einem MCP-Server verfügbar macht. Wenn also Ihre KI-Technologien, wenn Ihre KI-Projekte, äh, ihre Präzision mit Metadaten erhöhen wollen, dann, ähm, dann ist die Verbindung zu einem MCP-Server, äh, eine Möglichkeit, dies möglicherweise zu erreichen. In jeder Metadaten , äh, die mit KI arbeitet, ist dies meiner Meinung nach ein grundlegender Baustein, den man nicht ignorieren kann.

Ich hoffe, das beantwortet die Frage, und wenn nicht, bitte, bitte erweitern Sie sie. Ja, ich werde die Fragen und Antworten im Auge behalten, falls es weitere Fragen gibt. Aber da Sie über KI und Metadaten sprechen und wir auch Metadaten ausführlich über die Definition von Metadaten gesprochen haben.

Äh, eines der Phänomene der, wie Sie wissen, gängigen Verwendung von KI ist die Zusammenfassung. Menschen fassen lange Dokumente zusammen und, äh, Sie wissen schon, dann enthält das Ergebnis sozusagen die Essenz dieses Dokuments. Wie sehen Sie das?

Glauben Sie, dass automatische Zusammenfassungen oder KI-Zusammenfassungen nützliche Metadaten sind Metadaten eher ein Störfaktor, den man nicht wirklich abschalten kann und der nur zu unserem allgemeinen Missverständnis beiträgt? Wissen Sie, ich denke, ja, nun, meiner Meinung nach stehen wir noch ganz am Anfang, also wird sich das noch verbessern, es wird viel besser werden. Ich denke, wir sehen tatsächlich schon einige wirklich coole Ergebnisse, insbesondere in diesem speziellen Bereich.

Also, nein, nein, das stört mich überhaupt nicht. Und ich denke, dass die Präzision mit der Zeit zunehmen wird, aber ich denke, dass eine Maßnahme darin besteht, sehr sorgfältig über die einzigartigen Maßnahmen nachzudenken, die Sie in Ihrem Unternehmen durchführen. Ich denke, einige sehr altmodische Disziplinen, wie zum Beispiel das Erstellen eines Geschäftsglossars und das Verstehen Ihrer Taxonomien und Ontologien sowie der verschiedenen Technologien, die Sie einsetzen, sollten oberste Priorität haben, weil sie alles verbessern werden.

Äh, ja, das ist wirklich dringend notwendig, oder? Also, ich denke, das ist etwas, das, äh, das, äh, wir werden eine verstärkte, äh, verstärkte Aufmerksamkeit sehen. Nein, ich denke, Sie haben vollkommen Recht.

Ich habe sogar über dasselbe Thema nachgedacht. Ich denke, okay, man muss feinabstimmen Modelle auf der Grundlage des Glossars, das in seinem Bereich vorherrscht, feinabstimmen . Andernfalls erhält man dieses von KI generierte Glossar und, äh, äh, Wörter und Verwendungen, die nicht skalierbar sind.

Wissen Sie? Also müssen Sie feinabstimmen Modelle wahrscheinlich feinabstimmen , damit sie so reagieren, dass die Mitarbeiter in Ihrem Unternehmen oder in Ihrer Organisation sie verstehen, richtig? Also, ähm, in der Tat, in der Tat.

Ich, darf ich dazu etwas sagen, Abby? Ja, natürlich, natürlich. Ja, denn ich denke, einer der wirklich interessanten Aspekte hier ist, dass man die Erstellung eines Geschäftsglossars nicht automatisieren kann, das ist ein Zusatz.

Äh, das solltest du nicht tun. Du solltest es nicht einmal versuchen. Das Problem, mit dem du konfrontiert bist, ist, dass du so etwas wie – um es mit einem langen Wort zu sagen – eine Tologie erschaffst, aber ein einfacheres Wort wäre einfach eine Wiederholung.

Sie extrahieren nichts von irgendwoher. Sie wiederholen nur Dinge. Und so zu versuchen, Dinge auf der Metadaten zu wiederholen und zu sagen, jetzt haben wir ein Geschäftsglossar, jetzt haben wir eine Liste von Begriffen oder sogar eine Ontologie zu erstellen, die einfach auf KI basiert, wäre sehr chaotisch und sehr unproduktiv.

Und die Sache ist die: Wenn Sie das tun, wenn Sie diese menschliche Aktivität zu Beginn der Erstellung eines Geschäftsglossars oder einer Taxonomie oder sogar einer Ontologie durchführen, richtig? Wie ein Diagramm, das Sie erstellen, ja, das wirklich das Verständnis Ihres Unternehmens vereinheitlicht. Wenn Sie das tun und Sie das als Quelle für die Verbesserung der KI nutzen, dann profitieren Sie davon enorm.

Äh, man könnte, man könnte automatisch, also man könnte die Aktivität des Taggens durchführen. Ein ganz einfaches Beispiel: Man könnte die Aktivität des Taggens von Datenprodukten oder Datenbeständen in einem Datenkatalog durchführen, etwas, das die KI ausführen könnte. Aber wenn Sie das Geschäftsglossar erstellt haben, mit dem Sie diese Datenprodukte taggen, wenn Sie dieses Geschäftsglossar mit KI erstellt haben, bricht die gesamte Aktivität zusammen.

Es bringt keinen Mehrwert. Man kann also Wiederholungen automatisieren, aber keine einzigartigen menschlichen Handlungen. Die Erfindung des Wortes selbst ist etwas, das ein Mensch tun muss.

Genau. Nein, ich denke, das ist keine Schätzung, das habe ich gesagt, dass man sich bei Dingen wie Glossaren nicht auf KI verlassen kann, denn nein, wissen Sie, das ist kein Rezept für großen Erfolg. Ähm, okay, wenn wir also über KI und generative Inhalte sprechen, ähm, ähm, was sind Ihre empfohlenen Strategien, beispielsweise in der KI-Welt?

Äh, haben Sie darüber nachgedacht, äh, ich glaube nicht, dass Sie das im Buch selbst geschrieben haben, aber wie sollte der Arbeitsablauf bei der Entwicklung Metadaten mit KI Metadaten ? Sie sprechen von bestehenden Repositorien, wie sollen wir diese betrachten? Wie können wir sie mit KI erweitern? Wie können wir sie, äh, unternehmensweit bekannt machen?

Haben Sie darüber schon viel nachgedacht, oder was denken Sie darüber? Ja, sicher. In meinem Buch mache ich sehr deutlich, dass ich nicht glaube, dass eine Meta-Grid-Architektur etwas ist, das man in eine bestimmte Technologie einbauen sollte.

Es geht wirklich darum, den bestehenden Technologie-Stack und Metadaten, äh, Technologie-Stack , den Sie in Ihrem Unternehmen haben, zu verbessern. Wenn Sie also einen Datenkatalog oder zwei Datenkataloge oder fünf Datenkataloge haben, dann schlage ich sicherlich nicht vor, dass Sie zusätzlich zu all diesen Datenkatalogen neue Daten hinzufügen, um sie alle zu vereinen. Ich denke, das machen sie intern selbst.

Äh, und, äh, einer dieser fünf Datenkataloge könnte der Datenkatalog sein. Und das ist völlig in Ordnung. Ich schlage keine weitere Ebene darüber vor, und Sie erhalten eine weitere Technologie.

Was ich vorschlage, ist eine Methodik, um alle Teams, die mit Technologien arbeiten, organisatorisch zusammenzuführen, damit sie voneinander lernen und sich gegenseitig verbessern können. Und wenn wir dann wirklich vorankommen, stellen Sie sich zum Beispiel eine Liste von Anwendungen in einem Enterprise-Architektur-Management-Tool mit großartigen Beschreibungen vor, die speziell für die zukünftige Erforschung dessen gedacht sind, wie Sie Ihre IT-Landschaft kostengünstiger und leistungsfähiger gestalten können. Wenn Sie diese Liste nehmen und eng mit einer Konfigurationsmanagement-Datenbank abstimmen, dann haben Sie plötzlich eine bessere Konfigurationsmanagement-Datenbank und eine aktuellere und bereits vorhandene Konfigurationsmanagement-Datenbank, sobald diese Dinge an das andere Team übergeben werden.

Und wenn man all diese Teams und all diese Technologien nimmt und untersucht, wie sie zusammenarbeiten, dann kann man die Gesamtmenge an Technologien und ihre Leistung verbessern. Das kann also viel Zeit sparen, aber da Sie nach der KI fragen: Sie können auch diese Dokumentation, all diese Diagramme, all diese Beschreibungen von Metadaten verwenden und daraus eine Art Rack-Architektur erstellen, mit der Sie potenziell kommunizieren könnten, richtig? Zum Beispiel fragen, für welche Art von Metadaten sie verwendet werden, für welche Art von Dingen, richtig?

Und das horizontal zu erforschen. Aber da es sich um eine Technologie an sich handelt, glaube ich nicht, dass das der Sinn der Sache wäre. Ich möchte die bestehenden Technologien verbessern.

Okay. Das leuchtet ein. Ja.

Okay. Das leuchtet ein. Ähm, lassen Sie uns darüber sprechen, wissen Sie, ähm, wir haben das Wort Governance bisher noch nicht verwendet, aber lassen Sie uns das oft verwenden, ähm, viele Metadaten , die sozusagen an der Governance-Müdigkeit sterben, richtig?

Ähm, wie denken wir über Governance, wenn wir über, ähm, Metadaten sprechen? Welche Rolle spielt Governance und wie klein oder wie groß muss sie sein? Ich denke, das ist die Frage.

Mm-hmm. Ja. Also, ich denke, ich würde das in zwei Fragen aufteilen.

Eine Frage betrifft also Data Governance eine andere Frage betrifft die Verwaltung im Allgemeinen. Data Governance denke, Data Governance ist etwas, das typischerweise durchgeführt wird. Ja, ich mag es nicht, dass Data Governance typischerweise relativ im Silo durchgeführt Data Governance .

Ich würde mir wünschen, dass mehr Unternehmen in Bezug auf ihre Daten, Data Governance und Data Governance Perspektiven einen ganzheitlicheren Ansatz verfolgen würden. Einige Unternehmen verfügen definitiv über hervorragende Autoren und Vordenker, die dies erklären. Aber ich denke, dass Data Governance als eigenständige Disziplin innerhalb der Organisation horizontaler funktionieren sollten.

Und das bringt mich dazu, und ich kann das erklären, indem ich über Governance in allgemeineren Begriffen spreche. Sie haben also auch einen Chief Information Security Officer oder einen Datenschutzbeauftragten oder sogar Qualitätsbeauftragte, die sich mit der Messung des Niveaus von, äh, Training befassen. Ist es so, dass es ausreichend ist und so weiter, richtig?

Wenn Sie in einer regulierten Branche tätig waren, wissen Sie, dass Sie die damit verbundenen Prozesse kennen müssen und so weiter. Daher denke ich, dass der Governance-Aspekt insgesamt größer ist als nur Data Governance. Das würde ich sagen, oder?

Ich empfehle Data Governance wirklich sehr, mit anderen Governance- und Compliance-Abteilungen im Unternehmen zusammenzuarbeiten, um tatsächlich Verbesserungen zu erzielen, viel Zeit zu sparen und die Qualität der Metadaten ihren Technologien zu verbessern, damit sie zusammenarbeiten und effizientere Ergebnisse erzielen können. Nein, das ist fantastisch. Vielen Dank dafür.

Ich denke, Ihre Antwort hat mich daran erinnert, dass ein weiterer Aspekt, den Sie in Ihrem Buch ansprechen, die dunklen Metadaten sind. Könnten Sie ein wenig darüber sprechen und wie Sie das in Ihrem Buch behandeln? Und was meinen wir eigentlich mit dunklen Metadaten dunklen Daten?

Wie sollen wir das verstehen? Richtig. Ähm, wie war das noch mal mit Metadaten was haben Sie gesagt?

Nein, ich glaube, du sprichst von den dunklen Metadaten den dunklen Daten. Oh, dunkle, dunkle Metadaten. Ja.

Danke. Ja. Cool.

Danke. Danke, dass du das mitgebracht hast. Alles klar.

Ja, ich finde es toll, dass Sie das ansprechen, denn das ist wirklich etwas, das mir sehr am Herzen liegt. Wir sprechen hier von Dark Data, also Daten, die wir mit unseren Technologien noch nicht entdeckt haben, denen wir noch nicht begegnet sind. Und ich glaube daran.

Äh, aber dunkle Metadaten sind etwas, ähm, das ist, ähm, eigentlich ganz einfach zu erklären, oder? Jedes Mal, wenn wir eine neue Technologie implementieren, um unsere IT-Landschaft zu betrachten, beginnen wir leider, wie ich festgestellt habe, und das findet bei uns, um ehrlich zu sein, weltweit großen Anklang. Wir haben ein Whiteboard gestartet.

Wir beginnen damit, zu erklären, ähm, äh, wo wir sollten, was, welche Art von Struktur unser Unternehmen hat, welche Art von Mitarbeitern, welche Art von Daten und so weiter. Wir fangen also bei Null an, wir fangen jedes Mal, wenn wir eine Metadaten implementieren, bei Null an. Und ich glaube, das ist falsch, äh, weil die gesamte Semantik, alles, was wir abbilden wollen, bereits existiert.

Es existiert in Technologien, die uns nicht bekannt sind, weil wir in der Regel sehr im Silo arbeiten, nicht wahr? Denken Sie zum Beispiel an die Implementierung eines Datenkatalog eine Reihe von Dateningenieuren, Datenwissenschaftlern, KI-Analysten und was es sonst noch so gibt, Strategen beteiligt wären, die gemeinsam an der Implementierung eines Datenkatalog arbeiten. Aber wenn sie das Asset-Management-System-Team befragen würden, das normalerweise in der Finanzabteilung sitzt, oder wenn sie das Team für die Verwaltung von Aufzeichnungen und Informationen befragen würden, eine weitere Compliance-Funktion, die normalerweise in der Qualitäts- oder Rechtsabteilung angesiedelt ist, würden sie einen Großteil der Semantik und einen Großteil der Metadaten erhalten Metadaten sie selbst in einem Silo abzuleiten versuchen.

Sie würden es direkt aus der Box heraus bekommen. Und das sind meine dunklen Metadaten. Es sind all die Metadaten bereits in Ihrer Organisation vorhanden sind.

Und das ist die Realität in jedem einzelnen Unternehmen da draußen, nicht wahr? Jedes einzelne Unternehmen hat diese dunklen Metadaten, die in vielen verschiedenen Systemen unentdeckt herumliegen. Und sie liegen einfach zum Greifen bereit.

Und wenn Sie es nutzen, können Sie Ihre Initiativen, wie beispielsweise die Nutzung von Metadaten KI oder einfach die Implementierung neuer Technologien, schneller vorantreiben, viel schneller. Das sind also dunkle Metadaten. Es ist wirklich dieses Konzept, dass wir meiner Meinung nach die Realität der Metadaten in Unternehmen vorhandenen Metadaten ignorieren.

Es hat damit zu tun, wie Unternehmen diese Agenden vorantreiben. Es wird immer mit neuen Technologien vorangetrieben, in einer Kombination aus internen Mitarbeitern, die erfolgreich sein wollen, die befördert werden wollen, Beratern, die diesen Unternehmen bei der Implementierung von Technologien helfen, und dann Technologieanbietern, die die Software entwickelt haben, richtig? Ja.

Also, da gibt es keinen Weg drum herum. Und das ist eine Realität, die einen manchmal sehr ärgern kann, aber das ist einfach die Realität. Man kann da nicht raus.

Wie können wir diese Realität nutzen, um etwas Besseres, Schnelleres und Intelligenteres zu schaffen? Nun, meine Antwort lautet ganz einfach: Schauen Sie sich die bereits Metadaten an. Schauen Sie über Ihren Tellerrand hinaus.

Wenn Sie im Bereich Data Analytics tätig sind, wenn Sie Data-Scientist sind, wenn Sie KI sind, schauen Sie sich das Endpunktmanagementsystem an, das der Service Desk verwendet, um Laptops und iPhones an neue Mitarbeiter auszugeben. Dieses System enthält eine Menge Semantik. Schauen Sie sich das Wissensmanagementsystem an, das vor 10, 15 Jahren implementiert wurde, dort gibt es eine Menge Semantik.

Lassen Sie das nicht ungenutzt. Das sind Dark Data. Ich denke, Sie spielen darauf an, Metadaten zu betrachten Metadaten Disziplinen miteinander zu verbinden, um Ihre Geschäftsziele zu erreichen, anstatt in Silos zu arbeiten.

Verstehe ich Ihre Antwort richtig? Sie betrachten also vorhandene Daten und versuchen, die Punkte zu verbinden, um ... mm-hmm. Ihre Ziele zu erreichen.

Sie betrachten Endpunkte, Sie betrachten Wissensmanagement, und Wissensmanagement ist, wie Sie wissen, ein riesiger Bereich, eine Art Ort, an dem es viele Metadaten die organisatorische Kompetenz in Bezug auf Mitarbeiter gibt, richtig? Ich denke, Sie sprechen davon, diese vorhandenen Metadaten nutzen, Metadaten zukünftige Entwicklungsprogramme zu gestalten. Und anstatt ein komplett neues System aufzubauen, um zu messen, wie es den Mitarbeitern geht, denke ich, dass Sie darauf hinauswollen, richtig?

So habe ich das verstanden. Nun, der Zweck meines Buches ist es wirklich nicht zu sagen, dass man Technologie nicht implementieren sollte und dass man aufgeben sollte und alles ein Chaos ist. Was ich sage, ist, dass Unternehmen sich in der Regel in einem Chaos befinden, aber es gibt einen Weg aus diesem Chaos heraus.

Und dieses Durcheinander hat tatsächlich etwas extrem Mächtiges an sich. Wenn man es nur nutzt, wenn man alle Metadaten diesem Durcheinander aufdeckt, kann man tatsächlich die bestehenden Technologien verbessern und die Erfolgswahrscheinlichkeit bei der Implementierung neuer Technologien erhöhen. Ich bin also hier nicht gegen irgendetwas.

Ich bin nicht gegen Technologien. Ich bin nicht gegen Unternehmen oder Personen oder, oder, oder, oder Berater. Ähm, ich sage, dass wir auf eine Art und Weise arbeiten , die nicht die beste ist, um etwas anders zu machen.

Und das ist das Meta-Grid. Die Meta-Grid-Architektur besagt im Grunde genommen, dass man nicht versuchen soll, herauszufinden, über welche Anwendungen ein Unternehmen verfügt. Man soll nicht versuchen, herauszufinden, über welche Datentypen es verfügt.

Es ist bereits aufgelistet, es ist bereits verfügbar. Suchen Sie diese anderen Metadaten und Nutzen . Nutzen Sie sie, anstatt Ihre Zeit mit einem weiteren unrealistischen Greenfield-Projekt zu verschwenden.

46:33Ressourcen nutzen

Das ist, ähm, das ist, das ist, das ist die Denkweise in der medizinischen Architektur. Genau. Das habe ich auch so gesehen.

Ich bin der Meinung, man sollte das, was man bereits hat, nicht verwerfen, sondern darauf aufbauen. Richtig. Das habe ich auch gesagt.

Genau, und ich denke, wir sind oft in einem Mechanismus gefangen, der das Gegenteil fördert, wir sind oft in Greenfield-Projekten gefangen, weil sie so verlockend sind. Wenn man keine Altlasten hat, ist alles einfach. Richtig?

Das Problem ist jedoch, dass man das zwar in einer kleinen Blase, in einem kleinen Silo umsetzen kann, aber nie wirklich skalieren wird. Denn es berücksichtigt nicht die Welt drumherum, richtig? Man kann also vielleicht den Anfang machen und interessante Arbeit leisten, aber wenn man wirklich skalieren will, muss man mit seinen Kollegen sprechen, man muss sich mit den Menschen um einen herum auseinandersetzen.

Ja. Ja, genau so habe ich es verstanden. Und genau das habe ich gemeint, ich meine, man schaut sich die vorhandenen Ressourcen an, man verbindet sie miteinander und macht sie sinnvoll nutzbar.

Selbst wenn Sie ein Greenfield-Projekt durchführen, müssen diese auf der Grundlage vorhandener Ressourcen, die Sie in Form von Metadaten Daten haben, informiert werden, richtig? Also, ja. Ähm, ich glaube, wir haben das Thema Graph-Wissen und Graph-Ontologien angeschnitten, und die eine Frage, die ich in diesem Zusammenhang hatte, war: Was ist Ihr Entscheidungskriterium, wenn Sie sich zwischen Graph- oder Ontologie-Modellen und einem einfachen Schlüssel-Wert-Paar entscheiden müssen?

Wie sollen wir vorgehen, wann brauchen wir eigentlich Wissensgraphen und aufwendige Anthologien und solche Dinge? Also nicht nur Dokumente mit Schlüsselwerten, richtig? Ich glaube, wir nähern uns jetzt der subtilen Grenze zwischen Ratschlägen und Idealen, richtig?

Äh, meine Ideale, ich möchte sie ganz klar darlegen. Äh, sie basieren auf meinen eigenen Erfahrungen, aber ich begrüße es, wenn andere eine andere Meinung haben. Aber meiner Ansicht nach wäre es klug, sich für ein Diagramm zu entscheiden, es ist klug, sich für ein Diagramm zu entscheiden, ähm, ein Metadaten Metadaten .

Wissensgraphen sind also auf Metadaten für alles äußerst effizient. Für Metadaten sind sie wirklich großartig. Und ich kenne Datenkataloge, die auf Graphen basieren.

Ich kenne Enterprise-Architektur-Management-Tools, die auf Graphen basieren, und ich kenne auch andere Arten von Metadaten und Wissensmanagement-Tools, die ebenfalls auf Graphen basieren. Und ich finde, dass Graphen auf der Metadaten , auf der Data Layer , wirklich sehr gut funktionieren. Äh, ich bin mir nicht sicher, ob man ein ganzes Unternehmen mit einer Graphdatenbank betreiben kann.

Ich bin mir nicht sicher, ob ich Ihnen das raten würde. Das ist also der Unterschied, den ich sehe. Er besteht zwischen der Daten- und der Metadaten .

Nun, einige werden, einige werden, werden, werden darin unterscheiden, und das ist völlig in Ordnung. Das ist nur meine Sichtweise. Was ich als funktionierend gesehen habe, ist, dass ich weiß, dass Grafiken auf der Ebene der Zustände äußerst wirkungsvoll sind.

Okay. Die Stunde neigt sich dem Ende zu. Wenn es noch weitere Fragen aus dem Publikum gibt, können Sie diese gerne in die Frage-Antwort-Runde einbringen.

Äh, ich weiß, dass Sie einen festen Termin haben, und ich auch. Ja. Ähm, mal sehen, äh, während wir auf weitere Fragen warten, habe ich vielleicht noch eine Frage.

Eine letzte Frage meinerseits.

50:23Metadaten KI

Ähm, wissen Sie, ein Unternehmen, das Metadaten nicht wirklich über viele Metadaten verfügt und quasi bei Null anfängt, also eine Start-up-Umgebung, so etwas in der Art. Ähm, wie sollten sie vorgehen, ähm, wissen Sie, es gibt kein Konzept für ein Metagrid, weil sie nicht wirklich über eine Quelle verfügen, aus der sie bestehende Daten beziehen können. Ähm, was denken Sie über diese Umgebung, wissen Sie, eine völlig freie Umgebung, und wissen Sie, KI wird durch Metadaten angetrieben, wissen Sie, Einbettungen und alle möglichen Dinge.

Wie sieht Ihr idealer Ansatz für Metadaten in einer völlig neuen Umgebung aus? Wie sollten die Menschen Ihrer Meinung nach in einer solchen Umgebung darüber denken? Richtig?

Oh, nun, in einer solchen Umgebung denke ich, äh, äh, ich werde jetzt wie ein alter Mann klingen, aber ich denke, ich denke, wenn man seine Dokumentation im Voraus erstellt, spart man sich später eine Menge, eine Menge Zeit. Das ist ein typisches Start-up-Problem, oder? Man ist so klein, dass man keine Dokumentation braucht, und dann wächst man und explodiert förmlich, und dann findet man nichts mehr, richtig?

Ja. Aber wenn man in der Lage ist, die Dokumentation im Voraus zu erstellen, und vielleicht gerade in der heutigen Zeit, dann kann man meiner Meinung nach die Ergebnisse von Datenmanagement nutzen. Und ich denke, das ist ein entscheidender Faktor, oder?

Da wir uns in diesem KI-Wettlauf befinden, können Sie die Metadaten Ihnen registrierten Metadaten wirklich effektiv und sofort nutzen. Und ich denke, das verändert die Situation, das ist ein echter Game Changer. Ein echter Game Changer.

Nein, ich denke, das spricht mich an. Wissen Sie, ich glaube, wir waren eine Zeit lang der Meinung, dass wir keine Dokumentation brauchen, aber jetzt brauchen Maschinen viel Kontext und Dokumente, um präzise Antworten zu geben. Wir kehren also zu dem Punkt zurück, an dem wir diese Art von Dokumentation benötigen, um insbesondere mit KI erfolgreich zu sein.

Äh, wenn du willst, wir suchen doch die Wahrheit, oder? Genau.

Genau. Ja. Okay.

Nun, ähm, ich denke, wenn, äh, wenn es keine weiteren Fragen gibt, bin ich gerne bereit, zum Schluss zu kommen, äh, es sei denn, Sie haben noch eine weitere Frage. Nein, ich denke, äh, dann können wir zum Schluss kommen. Vielen Dank, dass Sie sich heute Zeit genommen haben. Äh, es gibt keine weiteren Fragen.

Ich denke, wir können das jetzt abschließen und ich möchte mich noch einmal bedanken. Ich hoffe, es war für das Publikum hilfreich, und ich freue mich darauf, zu sehen, ob es weiteres Interesse daran gibt, eine weitere Diskussion über Metadaten zu führen, Metadaten vielleicht eher darüber, wie diese bereits in der Industrie genutzt werden. Ich bin sicher, wir werden uns in Verbindung setzen und das herausfinden.

Sicher. Und wir sehen uns dann irgendwo auf der Welt bei Databricks-Veranstaltungen oder Action-Events oder vielleicht auch gemeinsamen Veranstaltungen. Wer weiß das schon genau.

Klar. Wir sehen uns. Mach's gut.