Datenplattform

Big Data als Dienstleistung (BDaaS)

Eine robuste, vielschichtige Datenplattform

Mithilfe von Cloud Diensten können Unternehmen Big Data as a Service (BDaaS) große oder komplexe Datensätze analysieren.

Warum ist Big Data as a Service so wichtig?

Der herkömmliche Ansatz für den Zugriff auf die Erkenntnisse, die big data liefert, besteht in der Anschaffung eines Cluster von Servern, die in einem Rechenzentrum vor Ort untergebracht sind. Dies erfordert Vorlaufkosten und Verzögerungen, während die IT-Abteilung Hardware- und Softwarekomponenten beschafft, installiert, konfiguriert und testet. Die Scalability ist auf die gekaufte Hardware beschränkt, und wenn die Kapazität erschöpft ist, bedeutet dies teure Upgrades und weitere Verzögerungen.

Was sind die Vorteile von Big Data as a Service?

Zu den wichtigsten Vorteilen der Nutzung von big data as a Service gehören folgende:

  • Cloud Economics - Das Unternehmen kann sich für einen Abonnementdienst ohne Vorabinvestitionen anmelden und muss nur für die verbrauchte CPU und den Speicherplatz zahlen.
  • Elastische Scalability - Ein Cloud Dienst kann CPU und Speicherplatz On Demand fast sofort und in weit größerem Umfang bereitstellen als ein in-house Rechenzentrum.
  • Wertschöpfung - Dies ist bei einem big data kürzer, da die erforderliche Hard- und Software verfügbar ist, sobald das Abonnement oder die Testphase beginnt - kein Warten auf die IT.
  • Systemverwaltung - Cloud Anbieter verwalten meisten einfachen Systemverwaltungsaufgaben und verringern so den Verwaltungsaufwand für in-house IT-Teams.
  • Software-Upgrades - Diese werden vom Cloud und/oder SaaS-Anbieter durchgeführt, wodurch sich die Downtime im Vergleich zu herkömmlichen On-Premise-Implementierungen verringern.
  • Hohe Verfügbarkeit - Cloud Lösungen können Wiederherstellung im Katastrophenfall bieten, indem sie Dienste auf mehrere Cloud in verschiedenen Regionen replizieren und so die Auswirkungen von Downtime durch Stromausfälle oder Naturkatastrophen, die ein einzelnes Rechenzentrum betreffen könnten, reduzieren.

Mögliche Herausforderungen

  • Daten-Compliance - Viele Unternehmen haben mit regulierten Daten zu tun, die vor Ort im Rechenzentrum des Unternehmens aufbewahrt werden müssen. Eine private Cloud erfüllt häufig die Compliance-Anforderungen, da die Daten die dedizierte Cloud des Unternehmens nie verlassen.
  • Datenanalyse - Die Daten müssen in die Cloud hochgeladen werden, um eine Datenanalyse durchzuführen. Dies kann Zeit in Anspruch nehmen. Im Idealfall erstellt das Unternehmen seinen Daten-Lake oder sein big data Warehouse in der von ihm bevorzugten Cloud , damit die Daten dort verarbeitet werden können, wo sie erstellt wurden.
  • Datenmigration - Der Wechsel zu einem anderen Cloud kann teuer werden, da dieser häufig eine auf dem Datenvolumen basierende Ausstiegsgebühr erhebt. Dies gilt für Datenangebote, die von Cloud SaaS-Anbietern bereitgestellt werden, oder für Datenlösungen von Cloud wie Google und AWS.

Big Data

Alle großen Cloud bieten Dienste für Kunden an, die ihre bestehenden big data in der Cloud planen. Dazu gehören:

  • Amazon Web Services (AWS) bietet Elastic MapReduce (EMR) zur Bereitstellung von BDaaS.
  • Microsoft Azure HDInsight ist eine Cloud big data , die verwaltete Hadoop-, Spark- und Hive-Cluster bereitstellt.
  • Google Cloud Platform (GCP) - Google Cloud Dataproc ist ein voll gemanagt Cloud Service für den Betrieb von Apache Spark und Apache Hadoop Clustern.
  • Actian bietet BDaaS an, das auf alle drei Cloud übertragbar ist und Kunden die Flexibilität bietet, Analysen durchzuführen, unabhängig davon, welche Cloud ihre Daten hostet.

Actian

Die Actian Data Platform wurde entwickelt, um BDaaS über AWS, Azure und Google Cloud anzubieten. Die Plattform nutzt die Hadoop Spark-API für den Zugriff auf Datenformate, einschließlich ORC und Parquet. Abfragen der Actian Data Platform können Daten über Data-Warehouse-Instanzen hinweg verbinden. Diese verteilte Anfrage ermöglicht es Kunden, ihre Daten in der Nähe des Ortes zu speichern, an dem sie erstellt werden, und Datenanalysen durchzuführen, wo immer sich die Daten befinden.

Die Funktionen der Actian Data Platform arbeiten mit gängigen Datenspeicherstrukturen, darunter S3-Buckets, Google Drive-Ordner und Azure Blob-Storage.

Betrugserkennung

Einer der größten Kfz-Versicherer Großbritanniens nutzt die Actian Data Platform zur Betrugserkennung. Viele Variablen fließen in die Berechnung der Versicherungsprämie eines potenziellen Kunden ein, wie z.B. demografische Daten, Kreditwürdigkeit, Versicherungsansprüche und Fahrverhalten. Sie nutzen Actian auch, um Modelle zur Erkennung von Anomalien und potenziellen betrügerischen Konten zu erstellen.

Bearbeitung von Ansprüchen im Gesundheitswesen

Die Bearbeitung von Ansprüchen im Gesundheitswesen kann sehr komplex und zeitaufwändig sein. Krankenversicherer sind auf externe Agenturen angewiesen, um Ansprüche zu validieren, sicherzustellen, dass Leistungserbringer den Patienten keine überhöhten Behandlungskosten in Rechnung stellen, und betrügerische Ansprüche aufzudecken. Big data as a Service spielt eine entscheidende Rolle, wenn es darum geht, dass genügend Rechenleistung für die Bearbeitung von Leistungsspitzen zur Verfügung steht. Zu den Anspruchsdaten gehören unstrukturierte Daten in Form von gescannten Dokumenten und strukturierte Daten aus Abrechnungssystemen, die verarbeitet werden müssen.

Einzelhandel

Ein großer US-amerikanischer Einzelhändler, der Hunderte von Convenience-Stores in Truckstops und Kleinstädten betreibt, nutzt BDaaS, um die Warenkörbe der Kunden zu analysieren und so die Produkte für jede Filiale zu optimieren. Eine französische Baumarktkette nutzt big data as a Service, um die künftige Nachfrage auf der Grundlage von Jahreszeiten, Feiertagen und erwarteten Wettermustern zu prognostizieren, damit sie ihre Lagerbestände proaktiv für die erwarteten Bedingungen aufstocken kann.