Blog | Datenintelligenz | | 2 Min. Lesezeit

Was ist Data Fingerprinting und Similarity Detection?

Daten-Fingerprinting

Zusammenfassung

  • Beim Data Fingerprinting wird jeder Datenspalte eine eindeutige „Signatur“ zugewiesen.
  • Nutzt KI/ML, um Muster zu erkennen und ähnliche Datensätze automatisch zu identifizieren.
  • Hilft dabei, Daten zu klassifizieren und mit Kontext zu versehen (z. B. durch Erkennung von Länderfeldern).
  • Reduziert den manuellen Aufwand für Datenverwalter verbessert die Dokumentation.
  • Unterstützt die Einhaltung von Vorschriften durch die Identifizierung sensibler oder personenbezogener Daten.

Mit dem Aufkommen von Big Data sind Unternehmen mit einer kolossalen Menge an Daten konfrontiert. Um ihre Daten zu verstehen und zu analysieren sowie die verschiedenen gesetzlichen Anforderungen zu erfüllen, ist es für Unternehmen unerlässlich, ihre Datenbestände zu dokumentieren. Es ist jedoch eine sehr schwierige, wenn nicht gar unmögliche Aufgabe , Tausende von Datensätzen von Hand zu dokumentieren und in einen Kontext zu stellen.

Oder Sie können Daten-Fingerprinting verwenden.

Was ist Data Fingerprinting?

Im Datenbereich stellt ein Fingerabdruck eine "Signatur" oder einen Fingerabdruck einer Datenspalte dar. Ziel ist es hier, diesen Spalten einen Kontext zu geben.

Mithilfe dieser Technologie kann ein Daten-Fingerabdruck automatisch ähnliche Datensätze in Ihren Datenbanken erkennen und diese einfacher dokumentieren, wodurch die Arbeit Datenverwalterweniger mühsam und effizienter wird. Unter der Aufsicht des Datenverwalters ermöglichen uns Daten-Fingerabdruck-Technologien beispielsweise zu erkennen, dass eine Datenspalte mit den Informationen „Frankreich“, „Vereinigte Staaten“ und „Australien“ für „Länder“ steht.

Daten-Fingerprinting

Im Falle Actian Data Intelligence-Plattformbesteht das Ziel unserer Metadaten darin, Ihren katalogisierten Datensätzen auf möglichst automatisierte Weise Bedeutung und Kontext zu verleihen. Mit unserem Maschinelles Lernen Actian Data Intelligence-Plattform die Actian Data Intelligence-Plattform Spalten Datensatz , analysiert sie und weist ihnen eine eigene „Signatur“ zu. Wenn sich diese Fingerabdrücke ähneln, Datenkatalog unser Datenkatalog dem Data Steward Vorschläge, ob er die entsprechenden Informationen miteinander verknüpfen sollte.

Diese Technologie ermöglicht es den behördlichen Datenschutzbeauftragten unter anderem, personenbezogene oder sensible Informationen, über die die Organisation in ihren Datenbanken verfügt, hervorzuheben und zu kennzeichnen.