Was ist Data Fingerprinting und Similarity Detection?
Mit dem Aufkommen von Big Data sind Unternehmen mit einer kolossalen Menge an Daten konfrontiert. Um ihre Daten zu verstehen und zu analysieren sowie die verschiedenen gesetzlichen Anforderungen zu erfüllen, ist es für Unternehmen unerlässlich, ihre Datenbestände zu dokumentieren. Es ist jedoch eine sehr schwierige, wenn nicht gar unmögliche Aufgabe , Tausende von Datensätzen von Hand zu dokumentieren und in einen Kontext zu stellen.
Oder Sie können Data Fingerprinting verwenden.
Was ist Data Fingerprinting?
Im Datenbereich stellt ein Fingerabdruck eine "Signatur" oder einen Fingerabdruck einer Datenspalte dar. Ziel ist es hier, diesen Spalten einen Kontext zu geben.
Mithilfe dieser Technologie kann ein „Data Fingerprint“ automatisch ähnliche Datensätze in Ihren Datenbanken erkennen und diese einfacher dokumentieren, wodurch die Arbeit Datenverwalterweniger mühsam und effizienter wird. Unter der Aufsicht des Data Stewards ermöglichen uns Data-Fingerprinting-Technologien beispielsweise zu erkennen, dass eine Datenspalte mit den Informationen „Frankreich“, „Vereinigte Staaten“ und „Australien“ die Kategorie „Länder“ darstellt.
Daten-Fingerprinting
Im Fall der Actian Data Intelligence Platformist es das Ziel unserer Metadaten , Ihren katalogisierten Datensätzen auf möglichst automatische Weise Bedeutung und Kontext zu verleihen. Mit unserem Maschinelles Lernen Technologien identifiziert die Actian Data Intelligence Platform Datensatz , analysiert sie und versieht sie mit einer eigenen "Signatur". Wenn sich einer dieser Fingerabdrücke ähnelt, macht unser Datenkatalog Vorschläge, ob der Data Steward die gleichen Informationen zu einem anderen Datensatz angeben sollte.
Diese Technologie ermöglicht es den behördlichen Datenschutzbeauftragten unter anderem, personenbezogene oder sensible Informationen, über die die Organisation in ihren Datenbanken verfügt, hervorzuheben und zu kennzeichnen.