Die Verwaltung von Daten zur rechtzeitigen Entscheidungsunterstützung ist eine Herausforderung. Die Datenmenge wächst weiter und wird in verschiedenen Formaten geliefert. Es gibt immer noch viele Datensilos, die Daten enthalten, die integriert werden müssen. Es gibt Versuche, eine einzige Quelle der Wahrheit für Daten, Informationen und Wissen zu schaffen, die das Unternehmen für die Zusammenarbeit im gesamten Unternehmen nutzen muss. Erste Ansätze sind in ERP-Systemen zu sehen, die über mehrere Funktionsbereiche in einem Unternehmen hinweg funktionieren. Angesichts des Wachstums und der Nutzung von Daten durch verschiedene Datenkonsumenten ist dies jedoch nicht ausreichend.
Was ist die Data-Hub-Architektur?
Data-Hub-Architekturen sind eine Sammlung von Daten und Informationen aus mehreren unterschiedlichen Quellen für spezifische Verbraucherentscheidungen. Die gesammelten Daten können sich überall und in jedem Format befinden. Der Hub verarbeitet die erforderlichen Daten und hilft dabei, das Datenrauschen zu beseitigen und die Leistung für Entscheidungen zu verbessern. Die Daten werden effizient, effektiv und wirtschaftlich integriert und organisiert, um funktionale Geschäftsergebnisse zu unterstützen.
Data Hubs können Daten aus verschiedenen Quellen wie Data Lakes nutzen. Die erstellte Data-Hub-Architektur hängt davon ab, dass die Datenkonsumenten und die zu treffenden Entscheidungen sowie die Datenquellen selbst verstanden werden und wie sie für die Bedürfnisse des Unternehmens miteinander in Beziehung stehen, d. h. im Wesentlichen für die Unterstützung von Geschäftsentscheidungen in allen Funktionseinheiten.
Die Data-Hub-Architektur muss die Wertschöpfungskette zwischen allen Funktionen und Datenübergängen berücksichtigen, die zwischen diesen Funktionen stattfinden, einschließlich automatisierter Datenentscheidungsaktivitäten, die in Funktionen der künstlichen Intelligenz (KI) und des Maschinelles Lernen (ML) zu finden sind. Der letztendliche Wert kann in vier eindeutigen Bereichen für die gelieferten, unterstützten und konsumierten Dienstleistungen und Produkte gesehen werden. Die vier Bereiche stehen im Zusammenhang mit Entscheidungen zu Innovation, Wachstum, Kundenbindung und Wettbewerbsanforderungen des Unternehmens.
Offene Datendrehscheiben helfen dabei, die unterschiedlichen Kriterien für den Datenzugang zu erfüllen, die von verschiedenen Personen im Unternehmen benötigt werden. Da jede Funktion und Rolle Daten unterschiedlich und manchmal auch auf die gleiche Weise benötigt. Offene Datenhubs helfen auch bei der Nutzung von Cloud , der Zusammenarbeit und der Integration zwischen verschiedenen Funktionsteams. Dies gilt insbesondere für die Zusammenarbeit zwischen Entwicklern, Datenwissenschaftlern und Dateningenieuren.
Datenintegrations-Hub-Architekturen helfen dabei, über den Daten-Hub multiple data zu verbinden, unabhängig davon, wo sie sich befinden, z. B. in der Cloud oder On-Premises. Dies hilft dabei, spezifische Systeme der Aufzeichnung zu erstellen, die für bestimmte Anwendungen der Daten benötigt werden.
Arten der Datendrehscheibenarchitektur
Data-Hub-Architekturen ermöglichen den Austausch von Daten, Informationen und Wissen durch die Zusammenarbeit zwischen bestimmten Datenproduzenten und bestimmten Datenkonsumenten. Dies sollte kunden- oder verbraucherorientiert erfolgen, damit die gesammelten Daten dem Kunden der Daten zugute kommen. Kundendaten-Hub-Architekturen sollten als der Ansatz betrachtet werden, der den Lebenszyklus von Kundendaten für eine intelligente Entscheidungsunterstützung im Unternehmen ermöglicht. Die Kundendatendrehscheibe sollte als Epizentrum für das Verständnis und die Reaktion auf Kundenbedürfnisse betrachtet werden.
Die Architekturen von Datendrehscheiben basieren auf den Datenmustern, die die Datenkonsumenten benötigen. Die Architektur einer Datendrehscheibe kann von Drehscheibe zu Drehscheibe unterschiedlich sein, je nach Dateninput und Datenkonsumenten. Obwohl sie einem grundlegenden Konstrukt wie Hub und Spoke folgt, kann jede Architektur sehr unterschiedlich sein, was die Art und Weise betrifft, wie die Daten für die Nutzung aufbereitet werden. Es werden nicht alle Datenquellen in den Hub kopiert, sondern nur die, die für Verbraucherentscheidungen benötigt werden.
Data Warehouse mit Nabe und Speiche vs. Bus-Architektur
Bei der Hub-and-Spoke-Datenarchitektur handelt es sich im Grunde um einen zentralisierten Ansatz zur Verbindung der Datendrehscheibe mit mehreren Eingängen oder Datenanbietern für verschiedene Datenkonsumenten. Ein Hub kann mit einer Spoke- oder einer Bus-Architektur erstellt werden. Eine Bus-Architektur wird verwendet, um ein Data Warehouse zu erstellen, das einem Hub ähnelt, aber die Daten haben keine Standardreferenz in Bezug auf die Datenkonsumenten. Spoke-Architekturen haben in der Regel den Hub als zentralen Punkt für Daten und sind daher oft der Standardbezugspunkt. In Anwendungsfällen, in denen eine strenge Kontrolle und Steuerung erforderlich ist, neigen Unternehmen dazu, Spoke- statt Bus-Architekturen zu verwenden. Der Bus kann alle Arten von Daten enthalten, aber die Anwendungen sind die Hauptquelle der Daten, die aus der großen Bus-Warehouse-Architektur zu extrahieren sind. Die Hub-and-Spoke-Architektur für den Data Hub ist explizit für die Verbraucher konzipiert. Hub und Spoke werden aufgrund der Spezifität der im Data Hub enthaltenen Daten als schneller angesehen.
Diagramm zur Architektur der Datendrehscheibe
Das folgende Diagramm der Daten-Hub-Architektur zeigt eine einfache Hub-and-Spoke-Perspektive zwischen den Daten und den Datenverbrauchern. Die Architektur kann multiple data enthalten, die für den Zweck der Datenkonsumenten geeignet sind. Dies fördert die Leistung und das allgemeine Verständnis dafür, wie die Daten für die Entscheidungsfindung innerhalb des Unternehmens genutzt werden.
Die Eingaben für die Datendrehscheibe können aus Data Warehouses, XML, JSON, Sharepoints, anderen Datensilos und von jedem anderen Ort stammen, an dem sich Daten befinden. Entscheidend ist dabei, dass beim Aufbau einer Datendrehscheibe die Datenauswahl, die für die Entscheidungen der Verbraucher benötigt wird, genau festgelegt wird. Andernfalls würde eine zu große Datenmenge, die verwalten muss, die Leistung beeinträchtigen und die Komplexität erhöhen.
Daten liefern Antworten in Form der Daten selbst oder der Umwandlung mit anderen Daten in Informationen und Wissen für den Verbraucher der Daten. Bei den Datenkonsumenten kann es sich um Menschen oder automatisierte Quellen handeln, wie z. B. beim Maschinelles Lernen und bei der künstlichen Intelligenz. In jedem Fall sollte das Unternehmen erkennen, dass die Anwendung einer Datendrehscheibe eine Initiative zur kontinuierlichen Verbesserung ist, um leistungsstarke Geschäftsergebnisse zu unterstützen.
Diagramm zur Architektur der Datendrehscheibe
Laden Sie das E-Book herunter, das wichtige Referenzarchitekturen für datengesteuerte Anwendungsentwickler und wichtige Cloud-Data-Warehouse-Anwendungsfälle enthält, die wichtige Bereiche abdecken, darunter: Customer 360-Echtzeit-Analysen, Lieferkettenanalysen, IT-Betriebsanalysen, IoT-gestützte Edge-to-Cloud-Analysen, maschinelles Lernen und Data Science sowie Analysen im Gesundheitswesen.