Data Analytics

Haben Sie große, schnelle, nutzlose oder hässliche Daten? Hier ist, was zu tun ist.

Teresa Wingfield

5. Januar 2023

Mann mit einem Tablet in der Hand, auf dem digital illustrierte Daten als Beispiel für unstrukturierte Daten erscheinen

Vor mehr als 20 Jahren hat die Meta Group (die von Gartner übernommen wurde) die 3Vs von Daten eingeführt: Volume, Velocity und Variety. Später erweiterte Gartner die 3Vs auf 5Vs, indem es Value und Veracity hinzufügte. Auch heute noch sind diese Faktoren wichtige Faktoren für die Data Analytics. Ihr Umfang und ihre Komplexität nehmen jedoch weiter zu. Hier ein Blick darauf, wo wir heute stehen, und einige Hinweise, wie wir Schritt halten können.

Illustrierte Infografik über die 5 Vs der Daten

Band

Das Datenvolumen bezieht sich auf den Umfang der Daten, die analysiert und verarbeitet werden müssen. Die Daten werden immer größer. IDC prognostiziert, dass das globale Datenvolumen bis 2025 auf 175 Zettabyte anwachsen wird. Mehr als die Hälfte davon, nämlich 90 Zettabyte, werden von Geräten des Internets der DingeIoT) stammen. Außerdem sagt Forbes voraus, dass bis 2025 150 Billionen Gigabyte an Echtzeitdaten analysiert werden müssen.

Zeiger:

  • Suchen Sie nach Lösungen, die mit dem Datenvolumen skalieren können.
  • Stellen Sie sicher, dass Sie Datenpipelines wiederverwenden und Daten für verschiedene Anwendungsfälle freigeben können.
  • Wählen Sie Echtzeitanalysen , die Ihre Key Performance Indicators und Service Level Agreements kennenlernen können.
  • Bewerten Sie die Fähigkeit der Lösung, konsistentes Management, Governance und Compliance zu bieten.

Geschwindigkeit

Geschwindigkeit bezieht sich auf die Geschwindigkeit, mit der Daten generiert werden. Daten werden immer schneller, vor allem durch die zunehmende Analyse von Echtzeit-Datenströmen, um verschiedene Anwendungsfälle wie IoT Data Analytics, Betrugserkennung, Online-Werbung, Cybersicherheit, log analytics, Aktienhandel und vieles mehr zu bewältigen. IDC schätzt, dass die von vernetzten IoT generierten Daten bis 2025 79,4 Zettabyte betragen werden, ein Anstieg von 13,6 ZB im Jahr 2019.

Zeiger:

  • Vorverarbeitung von Daten am Netzwerkrand, um die Kosten und den Aufwand für das Verschieben und Speichern von Daten zu reduzieren.
  • Testen Sie die Funktionen Ihrer Data Analytics , damit Sie schnell auf operative und gestreamte Daten zugreifen können.

Sorte

Vielfalt bezieht sich auf die Anzahl der Datentypen und umfasst strukturierte, halbstrukturierte oder unstrukturierte Daten. Die für Analysen benötigten Daten werden immer unübersichtlicher. Unstrukturierte Daten, d. h. Inhalte, die nicht einem bestimmten, vordefinierten Datenmodell entsprechen, nehmen rapide zu. IDC prognostiziert, dass 80 % der weltweiten Daten bis 2025 unstrukturiert sein werden. Etwa 90 % der unstrukturierten Daten wurden in den letzten zwei Jahren erstellt. Unternehmen analysieren heute nur 0,5 % der unstrukturierten Daten, aber dieser Anteil wird sicherlich bald steigen. Halbstrukturierte Daten wie JSON-, XML- und HTML-Formate nehmen aufgrund des Wachstums des Internets ebenfalls drastisch zu.

Zeiger:

  • Bewerten Sie die Fähigkeit der Lösung, Daten unabhängig von ihrer Struktur oder ihrem Format zugänglich zu machen.
  • Achten Sie auf die Flexibilität, benutzerdefinierte Verbindungen zu erstellen und Integrationen zu erweitern.

Wert

Der Wert bezieht sich darauf, ob sich die Daten positiv auf die Geschäftsergebnisse eines Unternehmens auswirken. Leider sind Daten oft nutzlos. Der Grund dafür ist einfach: Daten kennenlernen die Bedürfnisse der Nutzer nicht kennenlernen . Forrester stellt fest, dass weniger als 0,5 % aller Daten jemals analysiert und genutzt werden. Das Unternehmen schätzt außerdem, dass ein typisches Fortune-1000-Unternehmen, das die Datenverfügbarkeit um 10 % steigern könnte, einen zusätzlichen Nettogewinn von mehr als 65 Millionen US-Dollar erzielen würde.

Zeiger:

  • Finden Sie heraus, welche Daten Ihre Nutzer wirklich brauchen.
  • Priorisieren Sie Daten, die den Nutzern helfen, ihre Ziele kennenlernen .
  • Verstehen Sie die Probleme, die die Nutzer daran hindern können, die von ihnen benötigten Informationen zu erhalten.
  • Daten zeitnah und im richtigen Kontext zu präsentieren.

Wahrhaftigkeit

Wahrhaftigkeit bezieht sich auf die Qualität und Glaubwürdigkeit von Daten. Daten können hässlich sein, und Entscheidungen, die auf ihrer Grundlage getroffen werden, kosten Sie Geld. Nach Angaben von Gartner belaufen sich die finanziellen Auswirkungen schlechter Datenqualität auf ein Unternehmen auf durchschnittlich 15 Millionen US-Dollar pro Jahr.

Zeiger:

  • Stellen Sie sicher, dass Ihre Datenqualität anpassungsfähig und skalierbar ist.
  • Fügen Sie einen Automatisierungsgrad ein, der dazu beiträgt, Qualitätsdaten herauszufiltern und sie besser in das Unternehmen zu integrieren.
  • Verfolgen Sie einen kooperativen Ansatz für die Datenqualität im gesamten Unternehmen, um den Wissensaustausch und die Transparenz in Bezug auf die Speicherung und Verwendung von Daten zu erhöhen.

Zusätzliche Ressourcen:

teresa Nutzer avatar

Über Teresa Wingfield

Teresa Wingfield ist Director of Product Marketing bei Actian und sorgt für die Bekanntheit der Integrations-, Management- und Funktionen der Actian Data Platform. Sie verfügt über mehr als 20 Jahre Erfahrung im Marketing für Analyse-, Sicherheits- und Cloud bei Branchenführern wie Cisco, McAfee und VMware. Teresa konzentriert sich darauf, Kunden dabei zu helfen, mit Daten ein neues Innovations- und Umsatzniveau zu erreichen. Im Actian-Blog hebt Teresa den Wert von analytischen Lösungen in verschiedenen Branchen hervor. In ihren Beiträgen finden Sie Geschichten aus der Praxis.