Keine Datenvergeudung mehr: Mit Data Governance eine zukunftssichere Strategie aufbauen
Bob O'Donnell
29. Oktober 2024

Heutzutage ist es schwer, ein Unternehmen zu finden, das nicht versucht, sich selbst zu verbessern und data driven mit advanced analytics, KI oder Generative AI. Unternehmen aus allen Branchen versuchen händeringend, neue, aufkommende Technologien in ihre Umgebungen zu integrieren, in der Hoffnung, das viel gepriesene Versprechen einer höheren Produktivität und verbesserter Funktionen so schnell wie möglich zu erfüllen.
Die meisten Unternehmen stellen im Rahmen dieses Prozesses jedoch schnell fest, dass es viel schwieriger ist, ihre Datenbestände so zu organisieren, dass sie die Vorteile dieser Technologien voll ausschöpfen können. Die Gründe dafür sind vielfältig - von einer komplexen Mischung aus Datenformaten, Datensilos und Datenmanagement bis hin zur Unsicherheit darüber, wie man den Prozess, die Datenaufbereitung und -organisation am besten verwalten - und zusammengenommen werden diese Faktoren für viele Unternehmen schnell zu einem großen Stolperstein.
Laut einer aktuellen Umfrage von TECHnalysis Research unter IT-Entscheidern in über 1.000 US-Unternehmen, die mit GenAI arbeiten, ist die Datenaufbereitung und -integration eine der fünf größten Herausforderungen für Unternehmen. Interessanterweise gaben in einer ActianUmfrage unter 550 Fachleuten (70 % davon waren Direktoren oder höher) in 6 Ländern und 7 Branchen 79 % an, dass sie glauben, auf GenAI vorbereitet zu sein. Als Gartner jedoch die Verantwortlichen für die KI-Datenbereitschaft befragte, gaben nur 4 % an, dass sie bereit seien.
Ein weiteres Problem ist, dass die meisten Unternehmen keine organisierten Governance-Pläne für ihre Daten haben. Dieselbe Umfrage von TECHnalysis Research ergab, dass knapp 30 % der großen Unternehmen (1.000+ Mitarbeiter) und satte 64 % der mittleren Unternehmen (100-999 Mitarbeiter) keinerlei Governance-Pläne für ihre GenAI haben.
Ein Hauptproblem ist, dass viele Menschen nicht ganz verstehen, was data governance ist und warum sie wichtig ist. Hinzu kommt, dass selbst Unternehmen, die damit begonnen haben, Richtlinien und Verfahren für data governance zu entwickeln, nicht wissen, wie sie sicherstellen können, dass die richtige Art von Daten in ihre Algorithmen und großen Sprachmodelle (LLMs) eingespeist wird. Das Ergebnis ist, dass ein großer Prozentsatz der Unternehmen ihre kritischen Daten nicht so effektiv nutzt, wie es möglich wäre, und das wiederum führt in der Regel zu angepassten Modellen und Anwendungen, die nicht so effektiv oder produktiv sind, wie sie sein sollten. Laut Gartner werden bis 2027 60 % der Unternehmen den erwarteten Wert ihrer KI-Anwendungsfälle aufgrund uneinheitlicher ethischer Governance-Frameworks nicht realisieren können.
Um diese Probleme anzugehen, brauchen Unternehmen nicht nur eine breite Palette von Werkzeugen, um ihre Daten optimal zu organisieren, verwalten und für die Nutzung vorzubereiten, sondern auch einen Framework und eine Reihe von Leitlinien. Dadurch wird sichergestellt, dass die effektivsten Strategien und Verfahren für den Erwerb und die Nutzung von Daten vorhanden sind, um die Investitionsrentabilität bei der Einführung dieser neuen Technologien zu maximieren.
An dieser Stelle kommt ein Unternehmen wie Actian, eine Abteilung von HCL Software, ins Spiel. Actian bietet derzeit eine Reihe von Tools zur Organisation und Optimierung der Datenbestände eines Unternehmens für eine Vielzahl innovativer Technologien, einschließlich GenAI. Dies ist von entscheidender Bedeutung, denn wie viele Unternehmen bereits festgestellt haben, hängt die Qualität der von einer Anwendung erzeugten Ergebnisse in hohem Maße von der Qualität der Daten ab, auf denen das zugrunde liegende Modell trainiert wurde. Es ist ein klassischer Fall von "Garbage in, garbage out" - oder besser gesagt: Hochwertige Daten rein, effektive, wirkungsvolle und vertrauenswürdige Ergebnisse raus.
Die Tools von Actian reichen von der Datenorganisation bis hin zu advanced analytics und sind alle darauf ausgerichtet, große Datenmengen für die Aufnahme zu optimieren. Ein besonderer Schwerpunkt der Tools des Unternehmens liegt auf Metadaten, die sich schnell als wesentlicher Bestandteil des training erweisen. Je genauer und gründlicher die Daten eines Unternehmens mit Hilfe von Metadaten dokumentiert oder beschrieben werden können, desto effektiver kann ein Unternehmen diese Daten in seinem training für verschiedene Anwendungen, einschließlich GenAI, nutzen. Außerdem können gut dokumentierte Daten dazu beitragen, Halluzinationen und andere irreführende Ergebnisse zu reduzieren, zu denen alle LLMs gelegentlich noch neigen.
Um sein Angebot an Funktionen in diesen Bereichen zu erweitern, hat Actian vor kurzem den Kauf von Zeenea abgeschlossen, einem Unternehmen, das eine Data-Intelligence-Plattform entwickelt hat, die auf einem Datenkatalog. Mit dem Datenkatalog von Actian Zeenea können Unternehmen alle ihre verschiedenen Datenbestände in einer einzigen Katalogstruktur organisieren, die Metadaten nutzt, um ein einziges durchsuchbares Lager zu erstellen. Dies wiederum hilft Datenkonsumenten innerhalb einer Organisation, die benötigten Informationen entweder über eine einfache textbasierte Suche oder einen visuellen Knowledge Graph zu finden. Der Knowledge Graph nutzt semantische Metadaten , um eine Vielzahl unabhängiger Datenquellen miteinander zu verknüpfen und Kontext und leicht erkennbare visuelle Verbindungen zwischen diesen Datenbeständen herzustellen.
Die jüngste Erweiterung dieser Funktionen ist der neue Actian Zeenea Federated Datenkatalog, der das Konzept der Datenkatalogisierung auf eine neue Ebene hebt, indem er die Funktionen innerhalb einer Organisation integriert. Dieser föderierte Katalog nutzt einen domänenorientierten Datenmanagement , bei dem die Teams, die am besten mit den Daten vertraut sind, ihre eigenen Datenbestände, Berechtigungen und Governance in einem dedizierten Datenkatalog verwalten . Die Domänen können dann ihre wertvollsten Datenbestände in einem gemeinsam genutzten Enterprise Data Marketplace veröffentlichen, so dass sie als Produkte von allen Geschäftsfunktionen innerhalb des Unternehmens genutzt werden können. Durch die Verwendung der gleichen Prinzipien und Konzepte in den verschiedenen Bereichen erhalten Unternehmen eine dezentralisierte, aber konsistente Datenmanagement , die eine einfachere und effektivere Methode für die gemeinsame Nutzung wichtiger Daten bietet. Am wichtigsten ist jedoch, dass sie dies auf eine Art und Weise tun, die eine konsistente Reihe von Governance-Prinzipien bietet und ihnen hilft, potenzielle Probleme mit der Einhaltung von Vorschriften und anderen Daten zu vermeiden.
Neben diesen Werkzeugen für die Datenaufbereitung und -organisation bietet Actian Zeenea seinen Kunden auch eine getestete, ausgereifte Reihe von data governance und eine umfassende data governance Framework um sicherzustellen, dass Best Practices während des gesamten Datenaufbereitungsprozesses genutzt werden können.
Actian Zeenea's wirksam Data Governance Framework bietet ein einfaches, aber umfassendes Paket von Richtlinien und Verfahren, die dazu beitragen können, dass Organisationen unterschiedlicher Art und mit unterschiedlichen Anforderungen das Beste aus ihren Datenbeständen herausholen können. Das Framework ist mehr als nur eine Liste von Regeln, die es zu befolgen gilt. Es enthält Vorschläge zur Organisationsstruktur, zu Fragen und Themen, die in Besprechungen angesprochen werden sollten, zu Strategien für die Umsetzung einiger der Schlüsselkonzepte und vieles mehr.
Das Framework soll auch dazu beitragen, die Zustimmung der wichtigsten Entscheidungsträger einer Organisation zu gewährleisten - ein entscheidender Punkt für viele fortschrittliche Projekte - und bietet darüber hinaus wichtige praktische Vorteile. So kann ein ordnungsgemäß befolgtes Framework Organisationen dabei helfen, alle gesetzlichen und behördlichen Anforderungen einzuhalten, data driven Verzerrungen in den Ergebnissen zu vermeiden, den Verlust kritischen geistigen Eigentums zu verhindern, potenzielle ethische Probleme zu lösen und vieles mehr.
Es steht außer Frage, dass neue Technologien wie GenAI und die neuen Arten von Anwendungen, die diese Technologie ermöglicht, den Unternehmen ein erstaunliches neues Potenzial eröffnen, um ihre Produktivität zu steigern, ihren Konkurrenten voraus zu sein, ihr Ergebnis zu verbessern und wirklich "datengesteuert" zu werden. Gleichzeitig eröffnen sie, wie viele andere neue Technologien auch, das Potenzial für neue Arten von Risiken und Herausforderungen.
Daher müssen Unternehmen, die sich auf die neuen, spannenden Datenanwendungen wie GenAI einlassen wollen, sicher sein, dass sie für dieses Abenteuer gut vorbereitet sind. Zusammengenommen können Actians Datenvorbereitungstools zusammen mit Actian Zeeneas Data Intelligence Platform, Federated Datenkatalog und Governance Framework Unternehmen dabei helfen, einen reibungslosen, organisierten und umfassenden Datenvorbereitungsprozess durchzuführen. Wenn man bedenkt, wie wichtig dieser Prozess ist und wie sehr er sich auf den letztendlichen Erfolg oder Misserfolg von fortschrittlichen Dateninitiativen auswirken kann, ist es klar, dass es sich um ein Thema handelt, mit dem sich Unternehmen aller Arten und Größen jetzt schlauer machen müssen.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.