Wie künstliche Intelligenz Datenkataloge aufwertet
Actian Germany GmbH
5. Juni 2019

Können Maschinen denken? Die Rede ist von künstlicher Intelligenz, "dem größten Mythos unserer Zeit".
Eine einfache Definition für KI könnte lauten: "eine Reihe von angewandten Theorien und Techniken zur Entwicklung von Maschinen, die Intelligenz simulieren können". Zu diesen KI-Funktionen gehört das Deep Learning, eine automatisierte Lernmethode, die zur Verarbeitung von Daten eingesetzt wird.
Daten müssen verständlich und zugänglich sein. Mit Hilfe eines intelligenten Datenkatalog können Datennutzer, wie z.B. Data Scientists, einfach recherchieren und effizient die richtigen Datensätze für ihre Algorithmen Maschinelles Lernen auswählen.
Mal sehen, wie.
Suchmaschine: Erleichterung Datensatz Recherche
Durch die Verbindung mit allen Datenquellen eines Unternehmens kann ein Datenkatalog effizient ein Maximum an Dokumentation (auch Metadaten genannt) aus den Speichersystemen abrufen.
Diese Informationen, die in der Zeenea-Suchmaschine indexiert und gefiltert werden können, ermöglichen es den Datennutzern, schnell an die für ihre Informationssysteme benötigten Datensätze zu gelangen.
Empfehlungssystem
Orientierungshilfe für Datenwissenschaftler bei ihren Entscheidungen
Ein intelligenter Datenkatalog ist ein Werkzeug, das auf der "Fingerprinting"-Technologie beruht . Diese intelligente Funktion gibt den Datennutzern Empfehlungen, welche Datensätze für ihre Projekte am relevantesten sind, u. a. auf der Grundlage von:
- Wie die Daten verwendet werden.
- Die Qualität und Bewertung der Dokumentation.
- Seine früheren Recherchen.
- Wonach andere Benutzer suchen.
- ihren Datensätzen mehr Bedeutung zu verleihen.
Diese Funktion bietet Datenbenutzern, die für einen bestimmten Datensatz verantwortlich sind, Vorschläge für dessen Dokumentation. Diese Empfehlungen können z.B. mit Tags, Kontakten oder sogar Geschäftsbegriffen anderer Datensätze verknüpft werden:
- Die Analyse der Daten selbst (statistische Analyse).
- Das Schema, das anderen Datensätzen ähnelt.
- Die Links zu den Feldern des anderen Datensatzes.
- Die automatische Kontextualisierung von Datensätzen in einem Datenkatalog ermöglicht es jedem Nutzer , mit Daten zu arbeiten, die er versteht und die für seine Anwendungsfälle geeignet sind.
Automatische Datensatz : Visualisierung des Lebenszyklus Ihrer Daten
Wie bereits erwähnt, kann ein Datenkatalog mit Hilfe der Fingerprinting-Technologie andere Datensätze erkennen und mit ihnen verknüpfen. Wir sprechen hier von der Datenabfolge: eine visuelle Darstellung der Lebenszyklen von Daten.
Automatische Fehlererkennung: Auf Fehler in Datensätzen aufmerksam werden
Um mögliche Probleme bei der Dateninterpretation zu überwinden, muss ein intelligenter Datenkatalog in der Lage sein, Fehler oder Missverständnisse in der Qualität und Dokumentation der Daten automatisch zu erkennen.
Dieses Schlüsselmerkmal, das auf der Analyse der Daten oder ihrer Dokumentation beruht, muss die Nutzer der Daten auf ihre Integrität hinweisen.
GDPR-Benachrichtigung: Über sensible Informationen benachrichtigt werden
Ein intelligenter Datenkatalog muss in der Lage sein, personenbezogene/private Daten in jedem beliebigen Datensatz zu erkennen und sie auf seiner Schnittstelle zu melden. Diese Funktion hilft Unternehmen, auf die verschiedenen GDPR-Anforderungen zu reagieren, die im Mai 2018 in Kraft treten, und auch potenzielle Nutzer über die Sensibilitätsstufe und die Verwendung ihrer Daten zu informieren.
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden - Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.