Daten-Wiki

Actian Daten-Wiki

Häufig verwendete Begriffe aus der Welt der Daten, alle an einem Ort.

Aktive Metadaten sind Metadaten , die automatisch generiert, aktualisiert und über das gesamte Datenökosystem zugänglich gemacht werden.

Agentische KI - Autonome KI-Systeme, die proaktiv Aufgaben ausführen und Entscheidungen mit minimalem menschlichen Input treffen.

KI-Governance ist ein Framework und eine Politik, die eine verantwortungsvolle, ethische und gesetzeskonforme Nutzung von KI-Systemen gewährleistet.

KI-unterstützt bezieht sich auf Aufgaben, Entscheidungen oder Prozesse, die durch künstliche Intelligenz verbessert oder unterstützt werden, wobei der Mensch die Kontrolle behält und die endgültigen Entscheidungen trifft.

A Geschäftsglossar ist eine Sammlung standardisierter Definitionen für Geschäftsbegriffe, um das Verständnis teamübergreifend zu vereinheitlichen.

Compliance und Datenschutz Gewährleistung der Einhaltung von Vorschriften wie GDPR, CCPA und HIPAA.

A Datenkatalog ist ein strukturiertes Verzeichnis von Datenbeständen zur Verbesserung der Auffindbarkeit und des Verständnisses.

A Datenvertrag ist eine formelle Vereinbarung zwischen Datenproduzenten und -konsumenten, in der Datenerwartungen, Formate und SLAs zur Gewährleistung von Qualität und Beständigkeit festgelegt werden.

Demokratisierung von Daten bedeutet, Daten für nichttechnische Nutzer zugänglich und verständlich zu machen.

Datenstruktur ist eine zentralisierte Datenarchitektur für den Transport, die Speicherung, den Zugriff und die verwalten Daten in verschiedenen Umgebungen.

Data Governance ist eine Reihe von Richtlinien, Prozessen und Rollen, die die Qualität, Sicherheit und Verfügbarkeit der Daten eines Unternehmens gewährleisten und ihre ordnungsgemäße Nutzung und Verwaltung während ihres gesamten Lebenszyklus fördern.

Datenabfolge bezieht sich auf die Verfolgung des Ursprungs, der Bewegung und der Umwandlung von Daten in verschiedenen Systemen.

Datenkompetenz ist die Fähigkeit der Beteiligten, Daten zu lesen, zu verstehen und mit ihnen zu kommunizieren.

Datenmanagement ist der Prozess des Sammelns, Speicherns, Organisierens und Pflegens von Analysedaten in einer Weise, die ihre Zugänglichkeit, Zuverlässigkeit und Sicherheit gewährleistet.

A Datengeflecht ist eine dezentralisierte Datenarchitektur, die sich auf den Besitz einer Domäne konzentriert.

Monetarisierung von Daten ist die Umwandlung von Datenbeständen in finanziellen Wert durch direkte oder indirekte Mittel.

Beobachtbarkeit ist die Überwachung des Zustands und der Zuverlässigkeit von Datenpipelines und -systemen.

Dateneigentümer bezieht sich auf die Person, die für die Gesamtverwaltung und Kontrolle eines bestimmten Datensatz verantwortlich ist.

A Datenprodukt ist ein kuratierter, kontrollierter und wiederverwendbarer Datensatz , der auf die Bedürfnisse Nutzer abgestimmt ist und als Produkt mit klaren Eigentumsverhältnissen und Lebenszyklusmanagement behandelt wird.

Datenprofilierung ist die Analyse von Daten, um deren Struktur, Inhalt und Qualität zu verstehen.

Datenqualität ist die Messung der Genauigkeit, Vollständigkeit und Zuverlässigkeit von Daten.

Bereitschaft ist der Zustand von Daten, die sauber, vollständig und kontextreich genug für Analysen oder KI-Nutzung sind.

Daten-Residenz stellt sicher, dass die Daten innerhalb bestimmter geografischer oder gesetzlicher Grenzen bleiben.

Klassifizierung der Datensensibilität ist die Kennzeichnung von Daten nach dem Grad der PII (Personally Identifiable Information) und dem Risiko.

Data sharing ist die gemeinsame Nutzung von Daten innerhalb und außerhalb von Unternehmen mit Blick auf analytische Anwendungsfälle.

Datenhoheit ist das Konzept, dass Daten den Gesetzen und Vorschriften des Landes unterliegen, in dem sie erhoben werden.

Daten-Stewardship ist die Überwachung der Datenbestände einer Organisation, um sicherzustellen, dass diese zugänglich, zuverlässig und sicher sind.

Die Datenstrategie ist der übergreifende Plan zur verwalten, Nutzung und Wertschöpfung von Datenbeständen.

Datenvertrauen ist das Vertrauen in die Genauigkeit, Herkunft und Verwaltung von Daten.

Datenvirtualisierung abstrahiert den Datenzugriff ohne physische Replikation der Datenquellen.

DataOps wendet DevOps-Prinzipien auf Datenpipelines an, um Flexibilität und Qualität zu verbessern.

Unternehmensdaten-Marktplatz (EDM) ist eine Plattform für die gemeinsame Nutzung und den Austausch von Datenprodukten innerhalb einer Organisation.

Föderierte Data Governance ist ein dezentralisiertes Governance-Modell, bei dem einzelne Bereiche ihre Daten mit gemeinsamen Standards und Richtlinien verwalten , um Beständigkeit, Compliance und Verantwortlichkeit im gesamten Unternehmen zu gewährleisten.

Ein föderierter Wissensgraph ist ein Graph, bei dem Teile des Graphen für bestimmte Domänen isoliert sind, um die Domäne eindeutig auszudrücken, ohne andere Domänen zu zwingen, derselben Ontologie/Graphenstruktur zu folgen.

A flexibles Metamodell ist ein Metamodell, das durch einen Wissensgraphen unterstützt wird.

Governance durch Design ist die direkte Einbettung von Governance-Kontrollen und -Richtlinien in Datenverträge.

A Wissensgraph ist eine halbstrukturierte Datenbank, die völlig flexibel ist, was die Organisation und die Suche angeht, und die als Netzwerk visualisiert werden kann.

A LLM (Large Language Model) ist ein KI-Modell, das auf großen Textmengen trainiert wird, um menschenähnliche Sprache zu verstehen und zu erzeugen.

Ein Datenmanagement MDM) schafft eine zentrale Datenquelle wichtige Geschäftseinheiten.

Metadaten ist der Prozess der Organisation, Kontrolle und Nutzung von Metadaten (Daten über Daten), um die Zugänglichkeit, Qualität und usability von Daten zu verbessern und so letztendlich Data Governance und geschäftliche Entscheidungsfindung zu ermöglichen.

A Metamodell ist ein "Modell eines Modells" - es definiert die Struktur, die Regeln und die Beziehungen für die Konstruktion anderer Modelle innerhalb eines bestimmten Bereichs.

Ontologie bezeichnet die verwandten Konzepte innerhalb eines Bereichs. Eine Ontologie geht über eine Taxonomie hinaus, indem sie beschreibt, wie die Konzepte zusammenhängen und interagieren.

PII (Persönlich identifizierbare Informationen) sind sensible Daten, die eine besondere Behandlung und einen besonderen Schutz erfordern.

Durchsetzung von Richtlinien ist die automatische Anwendung von Regeln und Kontrollen zur Datennutzung.

RAG (Retrieval-Augmented Generation) ist eine KI-Technik, die die Genauigkeit und Relevanz von LLM (Large Language Model)-Outputs verbessert, indem sie es ihnen ermöglicht, auf Informationen aus externen Wissensquellen zuzugreifen und diese einzubeziehen, anstatt sich ausschließlich auf ihre vortrainierten Daten zu verlassen.

A semantische Schicht ist eine geschäftsfreundliche Abstraktion komplexer Datenquellen, die ein besseres Verständnis ermöglicht.

Synthetische Daten sind künstlich erzeugte Daten, die zu Testzwecken oder zur Analyse unter Wahrung der Privatsphäre verwendet werden.

Taxonomie ist eine hierarchische Klassifizierung von Daten in Kategorien und Unterkategorien.