Vous avez des données volumineuses, rapides, inutiles ou laides ? Voici ce qu'il faut faire.
Teresa Wingfield
5 janvier 2023

Cela fait plus de 20 ans que le Meta Group (racheté par Gartner) a introduit les 3 V des données, à savoir le volume, la vitesse et la variété. Gartner a ensuite étendu les 3V aux 5V en y ajoutant la valeur et la véracité. Aujourd'hui encore, ces éléments restent des considérations importantes dans l'analyse des données. Toutefois, leur taille et leur complexité ne cessent d'augmenter. Voici un aperçu de la situation actuelle et quelques conseils pour suivre le rythme.
Volume
Le volume de données fait référence à la taille des données qui doivent être analysées et traitées. Les données sont de plus en plus volumineuses. IDC prévoit que le volume de données mondial volume de données atteindra 175 zettaoctets d'ici 2025. Plus de la moitié de ce volume, soit 90 zettaoctets, proviendra des appareils de l'internet des objets (IdO). En outre, Forbes prévoit que 150 trillions de gigaoctets de données en temps réel devront être analysés d'ici 2025.
Points de repère :
- Recherchez des solutions capables de s'adapter aux volumes de données.
- Assurez-vous de pouvoir réutiliser les pipelines de données et de partager les données entre les différents cas d'utilisation.
- Choisissez des analyses des données en temps réel qui peuvent répondre à vos indicateurs de performance clés et à vos accords de niveau de service.
- Évaluer la capacité de la solution à offrir une gestion, une gouvernance et une conformité cohérentes.
Vélocité
La vélocité fait référence à la vitesse à laquelle les données sont générées. Les données deviennent de plus en plus rapides, en particulier avec l'analyse accrue des flux de données en temps réel pour répondre à divers cas d'utilisation tels que l'analyse des données des capteurs IoT, la détection des fraudes, la publicité en ligne, la cybersécurité, l'analyse des logs, les transactions boursières et bien d'autres encore. IDC estime que les données générées par les appareils IoT connectés représenteront 79,4 zettaoctets d 'ici 2025, contre 13,6 ZB en 2019.
Points de repère :
- Prétraiter les données à la périphérie afin de réduire les coûts et les efforts liés au déplacement et au stockage des données.
- Testez les capacités de chargement de données à grande vitesse de votre système d'analyse de données afin d'accéder rapidement aux données opérationnelles et aux données en continu.
Variété
La variété fait référence au nombre de types de données et comprend les données structurées, semi-structurées ou non structurées. Les données nécessaires à l'analyse sont de plus en plus mélangées. Les données non structurées, c'est-à-dire les contenus qui ne se conforment pas à un modèle de données spécifique et prédéfini, augmentent rapidement. IDC prévoit que 80 % des données mondiales seront non structurées d'ici 2025. Environ 90 % des données non structurées ont été créées au cours des deux dernières années. Les entreprises n'analysent aujourd'hui que 0,5 % des données non structurées, mais ce chiffre va certainement augmenter prochainement. Les données semi-structurées, telles que les formats JSON, XML et HTML, connaissent également une croissance spectaculaire en raison de l'essor du web.
Points de repère :
- Évaluer la capacité de la solution à rendre les données accessibles indépendamment de leur structure ou de leur format.
- Recherchez la flexibilité nécessaire pour créer des connecteurs personnalisés et étendre les intégrations.
Valeur
La valeur fait référence à l'impact positif des données sur les résultats commerciaux d'une entreprise. Malheureusement, les données sont souvent inutiles. La raison en est simple : les données ne répondent pas aux besoins des utilisateurs. Forrester constate que moins de 0,5 % de toutes les données sont analysées et utilisées. Il estime également que si l'entreprise type du classement Fortune 1000 était en mesure d'accroître l'accessibilité des données de 10 %, elle générerait plus de 65 millions de dollars de revenus nets supplémentaires.
Points de repère :
- Apprenez à connaître les données dont vos utilisateurs ont réellement besoin.
- Donner la priorité aux données qui aideront les utilisateurs à atteindre leurs objectifs.
- Comprendre les problèmes qui peuvent empêcher les utilisateurs d'obtenir les informations dont ils ont besoin.
- Présenter les données de manière opportune et dans le bon contexte.
La véracité
La véracité fait référence à la qualité et à la crédibilité des données. Les données peuvent être laides et les décisions prises sur la base de ces données coûtent de l'argent. Selon Gartner, l'impact financier de données de mauvaise qualité sur une organisation est d'environ 15 millions de dollars de pertes par an en moyenne.
Points de repère :
- Veillez à ce que la qualité de vos données soit adaptable et évolutif.
- Inclure un niveau d'automatisation qui peut aider à filtrer les données de qualité et à mieux les intégrer dans l'entreprise.
- Adopter une approche collaborative de la qualité des données dans l'ensemble de l'entreprise afin d'accroître le partage des connaissances et la transparence sur la manière dont les données sont stockées et utilisées.
Ressources complémentaires :
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.