Haben Sie große, schnelle, nutzlose oder hässliche Daten? Hier ist, was zu tun ist.
Teresa Wingfield
5. Januar 2023

Vor mehr als 20 Jahren hat die Meta Group (die von Gartner übernommen wurde) die 3Vs von Daten eingeführt: Volume, Velocity und Variety. Später erweiterte Gartner die 3Vs auf 5Vs, indem es Value und Veracity hinzufügte. Auch heute noch sind diese Faktoren wichtige Faktoren für die Data Analytics. Ihr Umfang und ihre Komplexität nehmen jedoch weiter zu. Hier ein Blick darauf, wo wir heute stehen, und einige Hinweise, wie wir Schritt halten können.
Band
Das Datenvolumen bezieht sich auf den Umfang der Daten, die analysiert und verarbeitet werden müssen. Die Daten werden immer größer. IDC prognostiziert, dass das globale Datenvolumen bis 2025 auf 175 Zettabyte anwachsen wird. Mehr als die Hälfte davon, nämlich 90 Zettabyte, werden von Geräten des Internets der DingeIoT) stammen. Außerdem sagt Forbes voraus, dass bis 2025 150 Billionen Gigabyte an Echtzeitdaten analysiert werden müssen.
Zeiger:
- Suchen Sie nach Lösungen, die mit dem Datenvolumen skalieren können.
- Stellen Sie sicher, dass Sie Datenpipelines wiederverwenden und Daten für verschiedene Anwendungsfälle freigeben können.
- Wählen Sie Echtzeitanalysen , die Ihre Key Performance Indicators und Service Level Agreements kennenlernen können.
- Bewerten Sie die Fähigkeit der Lösung, konsistentes Management, Governance und Compliance zu bieten.
Geschwindigkeit
Geschwindigkeit bezieht sich auf die Geschwindigkeit, mit der Daten generiert werden. Daten werden immer schneller, vor allem durch die zunehmende Analyse von Echtzeit-Datenströmen, um verschiedene Anwendungsfälle wie IoT Data Analytics, Betrugserkennung, Online-Werbung, Cybersicherheit, log analytics, Aktienhandel und vieles mehr zu bewältigen. IDC schätzt, dass die von vernetzten IoT generierten Daten bis 2025 79,4 Zettabyte betragen werden, ein Anstieg von 13,6 ZB im Jahr 2019.
Zeiger:
- Vorverarbeitung von Daten am Netzwerkrand, um die Kosten und den Aufwand für das Verschieben und Speichern von Daten zu reduzieren.
- Testen Sie die Funktionen Ihrer Data Analytics , damit Sie schnell auf operative und gestreamte Daten zugreifen können.
Sorte
Vielfalt bezieht sich auf die Anzahl der Datentypen und umfasst strukturierte, halbstrukturierte oder unstrukturierte Daten. Die für Analysen benötigten Daten werden immer unübersichtlicher. Unstrukturierte Daten, d. h. Inhalte, die nicht einem bestimmten, vordefinierten Datenmodell entsprechen, nehmen rapide zu. IDC prognostiziert, dass 80 % der weltweiten Daten bis 2025 unstrukturiert sein werden. Etwa 90 % der unstrukturierten Daten wurden in den letzten zwei Jahren erstellt. Unternehmen analysieren heute nur 0,5 % der unstrukturierten Daten, aber dieser Anteil wird sicherlich bald steigen. Halbstrukturierte Daten wie JSON-, XML- und HTML-Formate nehmen aufgrund des Wachstums des Internets ebenfalls drastisch zu.
Zeiger:
- Bewerten Sie die Fähigkeit der Lösung, Daten unabhängig von ihrer Struktur oder ihrem Format zugänglich zu machen.
- Achten Sie auf die Flexibilität, benutzerdefinierte Verbindungen zu erstellen und Integrationen zu erweitern.
Wert
Der Wert bezieht sich darauf, ob sich die Daten positiv auf die Geschäftsergebnisse eines Unternehmens auswirken. Leider sind Daten oft nutzlos. Der Grund dafür ist einfach: Daten kennenlernen die Bedürfnisse der Nutzer nicht kennenlernen . Forrester stellt fest, dass weniger als 0,5 % aller Daten jemals analysiert und genutzt werden. Das Unternehmen schätzt außerdem, dass ein typisches Fortune-1000-Unternehmen, das die Datenverfügbarkeit um 10 % steigern könnte, einen zusätzlichen Nettogewinn von mehr als 65 Millionen US-Dollar erzielen würde.
Zeiger:
- Finden Sie heraus, welche Daten Ihre Nutzer wirklich brauchen.
- Priorisieren Sie Daten, die den Nutzern helfen, ihre Ziele kennenlernen .
- Verstehen Sie die Probleme, die die Nutzer daran hindern können, die von ihnen benötigten Informationen zu erhalten.
- Daten zeitnah und im richtigen Kontext zu präsentieren.
Wahrhaftigkeit
Wahrhaftigkeit bezieht sich auf die Qualität und Glaubwürdigkeit von Daten. Daten können hässlich sein, und Entscheidungen, die auf ihrer Grundlage getroffen werden, kosten Sie Geld. Nach Angaben von Gartner belaufen sich die finanziellen Auswirkungen schlechter Datenqualität auf ein Unternehmen auf durchschnittlich 15 Millionen US-Dollar pro Jahr.
Zeiger:
- Stellen Sie sicher, dass Ihre Datenqualität anpassungsfähig und skalierbar ist.
- Fügen Sie einen Automatisierungsgrad ein, der dazu beiträgt, Qualitätsdaten herauszufiltern und sie besser in das Unternehmen zu integrieren.
- Verfolgen Sie einen kooperativen Ansatz für die Datenqualität im gesamten Unternehmen, um den Wissensaustausch und die Transparenz in Bezug auf die Speicherung und Verwendung von Daten zu erhöhen.
Zusätzliche Ressourcen:
Abonnieren Sie den Actian Blog
Abonnieren Sie den Blog von Actian, um direkt Dateneinblicke zu erhalten.
- Bleiben Sie auf dem Laufenden: Holen Sie sich die neuesten Informationen zu Data Analytics direkt in Ihren Posteingang.
- Verpassen Sie keinen Beitrag: Sie erhalten automatische E-Mail-Updates, die Sie informieren, wenn neue Beiträge veröffentlicht werden.
- Ganz wie sie wollen: Ändern Sie Ihre Lieferpräferenzen nach Ihren Bedürfnissen.