Grundlagen der Data Sharing - Ansätze, Vorteile und Lösungen

SaaS-Daten, Formen und Grafiken über dem Bild einer Frau in der Technologiebranche

Die Data sharing macht eine einzige Kopie der Daten für mehrere Anwendungen, Benutzer und externe Geschäftspartner verfügbar.

Warum ist die Data Sharing wichtig?

Die Data sharing ist wichtig, weil sie den Abonnenten kontrollierte, vertrauenswürdige und gepflegte Kopien hochwertiger Daten bietet. Die Data sharing ist effizienter und effektiver als mehrere unkontrollierte Kopien eines Datensatzes, die von internen und externen Organisationen verwendet werden.

Ansätze zur Data Sharing

Es gibt viele Möglichkeiten, Daten gemeinsam zu nutzen. Im Folgenden finden Sie einige gängige Beispiele:

  • Dateiübertragungsprotokoll (FTP): Betriebssystemordner, die Datendateien enthalten, können mit Hilfe von Mechanismen wie FTP und SFTP für externe und interne Benutzer freigegeben werden. Die Sicherheit wird durch Passwörter gewährleistet. Dies ist ideal für den Austausch von Software-Patches oder Dateien mit Kunden.
  • Cloud : Google, Amazon und Microsoft bieten skalierbar Dateispeicher an, die nicht durch physische Datenträgergrößen eingeschränkt sind, was sie ideal für die gemeinsame Nutzung von Dateien macht. Der Nutzer dieser Dateien benötigt lediglich Anmeldedaten und die URL der Datei oder des Ordners.
  • Web-API: Apache Kafka teilt Datenströme mit Hilfe eines Veröffentlichungs- und Abonnementsystems. Für konsumierende Anwendungen, die Datensätze nahezu in Echtzeit erhalten, wird eine Anwendungsprogrammierschnittstelle (API) bereitgestellt.
  • Ereignisgesteuerte Dienste: Ereignisverwaltungssysteme bieten sofortigen Zugriff auf Daten, die von Anwendungen wie Spielen, Aktienhandel, Navigationssystemen und Notfallwarnsystemen benötigt werden. In diesen Fällen werden Änderungen über APIs wie SMS und MQTT an die Client-Systeme übermittelt.
  • Herunterladen: Viele Datenveröffentlicher, wie z. B. die US-Regierung, geben ihre Daten gerne über einfache Web-Downloads weiter. Diese können im Seitentext verlinkt oder als URLs in E-Mails weitergegeben werden.
  • Datenbank: Data sharing kann über eine übergeordnete API wie SQL-Zugriff erfolgen. Dies erspart den Abonnenten das Extrahieren und Laden der Daten in ihr eigenes Data Warehouse. Dank des SQL-Zugriffs können Benutzer ihre BI-Dashboards auf das gemeinsame Data Warehouse verweisen, um Daten zu analysieren und zu visualisieren.

Vorteile der Data Sharing

Im Folgenden werden einige der vielen Vorteile der data sharing aufgeführt:

  • Verbessert die data governance durch die Förderung der Verwendung von Best-in-Class-Daten.
  • Senkt die Kosten für Datenmanagement , indem es die Anzahl der im Umlauf befindlichen Kopien der Daten begrenzt.
  • Verhindert die Verwendung von Daten im Silo , indem natürliche Datenbrücken zwischen Geschäftsbereichen oder Abteilungen geschaffen werden. Kundendaten sollten beispielsweise in einem einzigen Lager gespeichert werden, damit alle Abteilungen wissen, wie lange der Kunde schon treu ist und ob er ein Problem hat, das sich auf die Abrechnung auswirkt.
  • Die Herausgeber gemeinsam genutzter Daten behalten den alleinigen Schreibzugriff, um die Daten bei Bedarf zu aktualisieren und zu korrigieren. Auf diese Weise haben die Abonnenten immer Zugang zu aktuellen, hochwertigen Daten.
  • Data sharing ist eine Form der Demokratisierung der Datenanalyse durch die Bereitstellung sauberer, hochwertiger Daten für bürgerliche Datenanalysten und Datenexperten.

Data Sharing mit Actian

Die Actian Data Platform ist eine ideale SQL-basierte Datenlösung. Vorgefertigte Konnektoren zu Hunderten von Datenquellen machen die Datenintegration einfach. Die Daten können mit starker Verschlüsselung sicher gespeichert und übertragen werden. Analytische und transaktionsverarbeitende Datenbankservices können für selbstverwaltete Instanzen heruntergeladen oder über ein Abonnement einer Cloud , einschließlich AWS, Azure und Google Clouds, abgerufen werden.

Datenveröffentlicher können für ihre Daten Geld verlangen. Refinitiv, ein ActianKunde, veröffentlicht hochwertige Aktieninformationen in seinem Elektron-Feed, der Actian Vector Columnar-Datenbanken als Backend nutzt, um Daten mit Latenzzeiten von 20 Millisekunden oder weniger zu liefern.

Die Clinical Trial Service and Epidemiological Studies Unit (CTSU) im Nuffield Department of Population Health der Universität Oxford hat die hybride Actian X Unternehmensdatenbank für operative Analysen der nächsten Generation eingesetzt. Mit Actian X können die Forscher der CTSU Ad-hoc-Analysen für große Datenmengen durchführen und erhalten Antworten innerhalb von Minuten - sogar Sekunden - statt Tagen.

Actian DataConnect ist in die Actian Data Platform integriert und ermöglicht Unternehmen die Aufbereitung und gemeinsame Nutzung von Daten. Mit einem einfachen visuellen Studio können Daten profiliert, transformiert und Datenbewegungen geplant werden.