Daten-Intelligenz

Wie künstliche Intelligenz Datenkataloge aufwertet

Actian Germany GmbH

5. Juni 2019

KI verbessert Datenkataloge

Können Maschinen denken? Die Rede ist von künstlicher Intelligenz, "dem größten Mythos unserer Zeit".

Eine einfache Definition für KI könnte lauten: "eine Reihe von angewandten Theorien und Techniken zur Entwicklung von Maschinen, die Intelligenz simulieren können". Zu diesen KI-Funktionen gehört das Deep Learning, eine automatisierte Lernmethode, die zur Verarbeitung von Daten eingesetzt wird.

Daten müssen verständlich und zugänglich sein. Mit Hilfe eines intelligenten Datenkatalog können Datennutzer, wie z.B. Data Scientists, einfach recherchieren und effizient die richtigen Datensätze für ihre Algorithmen Maschinelles Lernen auswählen.

Mal sehen, wie.

Suchmaschine: Erleichterung Datensatz Recherche

Durch die Verbindung mit allen Datenquellen eines Unternehmens kann ein Datenkatalog effizient ein Maximum an Dokumentation (auch Metadaten genannt) aus den Speichersystemen abrufen.

Diese Informationen, die in der Zeenea-Suchmaschine indexiert und gefiltert werden können, ermöglichen es den Datennutzern, schnell an die für ihre Informationssysteme benötigten Datensätze zu gelangen.

Empfehlungssystem

Orientierungshilfe für Datenwissenschaftler bei ihren Entscheidungen

Ein intelligenter Datenkatalog ist ein Werkzeug, das auf der "Fingerprinting"-Technologie beruht . Diese intelligente Funktion gibt den Datennutzern Empfehlungen, welche Datensätze für ihre Projekte am relevantesten sind, u. a. auf der Grundlage von:

  • Wie die Daten verwendet werden.
  • Die Qualität und Bewertung der Dokumentation.
  • Seine früheren Recherchen.
  • Wonach andere Benutzer suchen.
  • ihren Datensätzen mehr Bedeutung zu verleihen.

Diese Funktion bietet Datenbenutzern, die für einen bestimmten Datensatz verantwortlich sind, Vorschläge für dessen Dokumentation. Diese Empfehlungen können z.B. mit Tags, Kontakten oder sogar Geschäftsbegriffen anderer Datensätze verknüpft werden:

  • Die Analyse der Daten selbst (statistische Analyse).
  • Das Schema, das anderen Datensätzen ähnelt.
  • Die Links zu den Feldern des anderen Datensatzes.
  • Die automatische Kontextualisierung von Datensätzen in einem Datenkatalog ermöglicht es jedem Nutzer , mit Daten zu arbeiten, die er versteht und die für seine Anwendungsfälle geeignet sind.

Automatische Datensatz : Visualisierung des Lebenszyklus Ihrer Daten

Wie bereits erwähnt, kann ein Datenkatalog mit Hilfe der Fingerprinting-Technologie andere Datensätze erkennen und mit ihnen verknüpfen. Wir sprechen hier von der Datenabfolge: eine visuelle Darstellung der Lebenszyklen von Daten.

Automatische Fehlererkennung: Auf Fehler in Datensätzen aufmerksam werden

Um mögliche Probleme bei der Dateninterpretation zu überwinden, muss ein intelligenter Datenkatalog in der Lage sein, Fehler oder Missverständnisse in der Qualität und Dokumentation der Daten automatisch zu erkennen.

Dieses Schlüsselmerkmal, das auf der Analyse der Daten oder ihrer Dokumentation beruht, muss die Nutzer der Daten auf ihre Integrität hinweisen.

GDPR-Benachrichtigung: Über sensible Informationen benachrichtigt werden

Ein intelligenter Datenkatalog muss in der Lage sein, personenbezogene/private Daten in jedem beliebigen Datensatz zu erkennen und sie auf seiner Schnittstelle zu melden. Diese Funktion hilft Unternehmen, auf die verschiedenen GDPR-Anforderungen zu reagieren, die im Mai 2018 in Kraft treten, und auch potenzielle Nutzer über die Sensibilitätsstufe und die Verwendung ihrer Daten zu informieren.

actian avatar logo

Über Actian Corporation

Actian macht Daten einfach. Unsere Datenplattform vereinfacht die Verbindung, Verwaltung und Analyse von Daten in Cloud-, Hybrid- und lokalen Umgebungen. Mit jahrzehntelanger Erfahrung in den Bereichen Datenmanagement und -analyse liefert Actian leistungsstarke Lösungen, die es Unternehmen ermöglichen, datengesteuerte Entscheidungen zu treffen. Actian wird von führenden Analysten anerkannt und wurde für seine Leistung und Innovation mit Branchenpreisen ausgezeichnet. Unsere Teams präsentieren bewährte Anwendungsfälle auf Konferenzen (z. B. Strata Data) und tragen zu Open-Source-Projekten bei. Im ActianBlog behandeln wir Themen wie Echtzeit-Dateneingabe, Datenanalyse, Data Governance, Datenmanagement, Datenqualität, Datenintelligenz und KI-gesteuerte Analysen.