Demokratisierung von Daten für Nutzer unterschiedlicher Qualifikationsniveaus und Charaktere
Wenn Sie als Dateningenieur oder Datenarchitekt tätig sind, liegen Sie wahrscheinlich nachts wach und fragen sich, wie Sie Ihre Plattformen für Datenintegration, -verwaltung und -analyse so gestalten können, dass Ihre DBA- und IT-Ops-Kollegen verwalten problemlos verwalten können, während eine vielfältige Gruppe von Datennutzern sie gleichzeitig nutzen kann. Diese Nutzer reichen von neuen, anspruchsvollen, praxisorientierten Anwendern wie Entwicklern und Datenwissenschaftlern über diejenigen, die die Daten traditionell über SQL und Ad-hoc-Abfragen nutzen, wie beispielsweise Business-Analysten, bis hin zu denjenigen, die über Geschäftsanwendungen indirekt mit den Daten interagieren.
Nicht jeder in Ihrem Unternehmen ist ein Data-Scientist angesichts ihrer Knappheit müssten Sie schon ein recht kleines Unternehmen sein, wenn sie die Mehrheit der Belegschaft ausmachen würden. Auch auf die Gefahr hin, die Rolle von Datenwissenschaftlern zu verallgemeinern: Sie benötigen in der Regel Daten, die die Entwicklung und Training unterstützen, die nachgelagert eingesetzt, eingebettet andere Anwendungen eingebettet und von anderen Nutzern verwendet werden können. Datenwissenschaftler benötigen oft große und vielfältige Datensätze, die jedoch selten in Echtzeit vorliegen müssen; dennoch ist Aktualität eine oberste Anforderung, da sie Training heuristische Training Modelle iterativ durchführen.
Anwendungsentwickler interagieren, ähnlich wie Datenwissenschaftler, in der Regel über Programmier-APIs mit ihren Daten. Die Datensätze, mit denen sie arbeiten, sind meist kleiner oder bestehen aus Zeitreihen und Echtzeitdaten, eingebettet in den Geschäftsprozess eingebettet , anstatt diesen zu beeinflussen, wie Data-Scientist bei Data-Scientist eines Data-Scientist oft der Fall ist. Für Business-Analysten sind die Anforderungen wiederum anders, und für Endnutzer geht es darum, die Daten für ihre Abläufe unsichtbar zu machen – auch wenn diese für die Abläufe integraler und unverzichtbarer Bestandteil sind. Der springende Punkt ist, dass Entwickler von Datensystemen in der Lage sein müssen, Daten bereitzustellen, und zwar für verschiedene Gruppen, die nicht über dieselben Fähigkeiten, Rollen, Verantwortlichkeiten oder Interessen in Bezug auf Daten verfügen.
Welche Anforderungen stellt dies an Dateningenieure oder Datenarchitekten? Ganz einfach: Daten so aufzubereiten, dass Menschen mit unterschiedlichen Kenntnissen das finden, was sie brauchen – wann immer sie es brauchen und auf die für sie sinnvollste Weise. Okay, vielleicht ist es doch nicht ganz so einfach. Wie vermeidet man im Silo von maßgeschneiderten Systemen verwaltet werden, wenn man sich zu sehr auf jede dieser Zielgruppen konzentriert?
Verstehen Sie Ihre Nutzer und wie sie Daten nutzt
Jeder in Ihrem Unternehmen hat ganz individuelle Datenanforderungen, sowohl hinsichtlich der Art der Daten und der Tools, die er oder sie benötigt, als auch hinsichtlich der Frage, wie diese Datennutzung als effektiv angesehen wird. Möglicherweise gibt es einige Nutzer, die Zugriff auf einen ganz bestimmten Datensatz benötigen, Datensatz eine gezielte Aufgabe zu erledigen, Aufgabe andere Nutzer beispielsweise Daten mit einem Gesamtüberblick für die Planung und strategische Entscheidungsfindung benötigen. Einige Ihrer Nutzer benötigen detaillierte Rohdaten, während andere kuratierte Dashboards, Berichte und Visualisierungen benötigen. In vielen Fällen ist es dasselbe Nutzer in jedes der oben genannten Szenarien passen, allerdings in unterschiedlichen Phasen eines Projekts. In anderen Fällen nutzen diese verschiedenen Szenarien dieselben Daten in unterschiedlicher Form oder auf unterschiedliche Weise aufbereitet und in Kombination mit anderen Datensätzen.
Um zu verstehen, wie man seine Datennutzer erfolgreich macht, muss man das Qualifikationsniveau der Nutzer sowie die Tools und Datensätze kennen, die sie benötigen. So verbringen Datenwissenschaftler beispielsweise zusätzlich zu den oben genannten Datensätzen in der Regel viel Zeit damit, Daten aufzubereiten und Algorithmen manuell zu programmieren oder Bibliotheken für KI und ML wie TensorFlow zu nutzen. Umgekehrt neigen Business-Analysten eher dazu, SQL für die Berichterstellung sowie gängige BI- und Visualisierungstools für die abgefragten Datensätze einzusetzen. Power-User auf der Geschäftsseite sind zwar in der Lage, einfachere Abfragen zu bearbeiten, fühlen sich jedoch am wohlsten bei der Bearbeitung von Tabellenkalkulationen, wie beispielsweise Ihre Mitarbeiter in der Finanz- und Planungsabteilung. Jeder dieser Nutzer hat ganz eigene Anforderungen, nicht nur an die Daten, sondern auch an die Tools, die tatsächlich bestimmen, wie sie Daten für ihre Arbeit nutzen. Hier erfahren Sie mehr über das Angebot an Datenmanagement .