Intelligence des données

Révolutions des données : Vers une vision commerciale des données

Actian Corporation

19 août 2019

révolutions des données

L'utilisation de données massives par les géants de l'internet dans les années 2000 a été un signal d'alarme pour les entreprises : Le Big Data est un levier de croissance et de compétitivité qui favorise l'innovation. Aujourd'hui, les entreprises se réorganisent autour de leurs données pour adopter une approche "data-driven". C'est une histoire à rebondissements qui tend à trouver une solution.

Cet article examine les différentes révolutions des données d'entreprise entreprises entreprises au cours des dernières années jusqu'à aujourd'hui dans le but de maximiser la valeur commerciale des données.

en silo Architectures

Dans les années 80, les systèmes d'information ont connu un développement considérable. Des applications commerciales ont été créées, des langages de programmation avancés sont apparus, ainsi que des bases de données relationnelles. Toutes ces applications sont restées sur les plateformes leurs propriétaires, isolées du reste de l'écosystème informatique. 

Pour ces raisons historiques et technologiques, les données internes d'une entreprise étaient distribuées dans des technologies diverses et des formats hétérogènes. technologies diverses et dans des formats hétérogènes. En plus des problèmes organisationnels, on parle alors d'un effet tribal. Chaque service informatique dispose de ses propres outils et gère implicitement ses propres données pour ses propres usages. On assiste à une sorte de d'accumulation de données au sein des organisations. A l'appui de ces suggestions, on rappelle souvent la loi de Conway : "Toute architecture est le reflet de l'organisation qui l'a créée. Ainsi, cette organisation, dite en silos, rend les croisements de données très complexes et onéreux. complexe et onéreuse de croiser des données provenant provenant de deux systèmes différents.

La recherche d'une vision centralisée et globale des données d'une entreprise conduira les systèmes d'information à une nouvelle révolution.

Le concept d'entrepôt de données

À la fin des années 90, l'informatique décisionnelle est en plein essor. À des fins analytiques et dans le but de répondre à toutes les questions stratégiques, le concept d'entrepôt de données est apparu. 

Pour ce faire, on va récupérer les données des ordinateurs centraux ou des bases de données relationnelles et les transférer à un ETL (Extract Transform Loader). Projetées dans un format dit pivot, les analystes et les décideurs peuvent accéder aux données collectées et mises en forme pour répondre à des questions préétablies et à des cas de réflexion spécifiques. A partir de la question, on obtient un modèle de données.

Cette révolution s'accompagne toujours d'un certain nombre de problèmes. L'utilisation d'outils ETL a un certain coût, sans parler du matériel qui l'accompagne. Le temps écoulé entre la formalisation du besoin et la réception du rapport est chronophage. C'est une révolution coûteuse pour une efficacité perfectible.

La nouvelle révolution du lac de données

L'arrivée des lacs de données renverse le raisonnement précédent. Un lac de données permet aux organisations de centraliser tous les stockages de données utiles, indépendamment de leur source ou de leur format, pour un coût très faible. . Nous stockons les données d'une entreprise sans présumer de leur utilisation dans le traitement d'un cas d'usage futur. Ce n'est qu'en fonction d'un usage spécifique que nous sélectionnerons ces données brutes et les transformerons en informations stratégiques.

Nous passons d'une logique "a priori" à une logique "a posteriori".. Cette révolution d'un lac de données met l'accent sur de nouvelles compétences et connaissances : les data scientists et les data engineers sont capables de lancer le traitement des données, en produisant des résultats beaucoup plus rapidement que le temps passé à utiliser les entrepôts de données.

Un autre avantage de cette terre promise est son prix. Souvent proposés en open-source, les lacs de données sont bon marché, y compris le matériel qui les accompagne. On parle souvent de matériel communautaire.

...ou plutôt un marais de données

Certains avantages sont présents avec la révolution des lacs de données mais s'accompagnent de nouveaux défis. L'expertise nécessaire à l'instanciation et à la maintenance de ces lacs de données est rare et donc coûteuse pour les entreprises. De plus, déverser des données dans un lac de données jour après jour sans une gestion ou une organisation efficace comporte le risque sérieux de rendre l'infrastructure inutilisable. Les données sont alors inévitablement perdues dans la masse.

Cette gestion des données s'accompagne de nouvelles problématiques liées à la réglementation des données (GDPR, Cnil, etc.) et à la sécurité des données : des sujets déjà présents dans le monde de l'entrepôt de données. Trouver les bonnes données pour le bon usage n'est pas encore chose aisée.

Le règlement : Construire la gouvernance données

Les géants de l'internet ont compris que la centralisation de ces données est un premier pas, certes insuffisant. La dernière brique nécessaire pour aller vers une approche "data-driven" est de construire une gouvernance données. Innover grâce aux données nécessite une meilleure connaissance de ces données. Où sont stockées mes données ? Qui les utilise ? Avec quel objectif ? Comment sont-elles utilisées ?

Pour aider les professionnels des données à représenter et à visualiser le cycle de vie des données, de nouveaux outils sont apparus : nous les appelons "catalogues de données". Situés au-dessus des infrastructures de données, ils permettent de créer un répertoire de métadonnées consultable. Ils permettent d'acquérir une vision métier et technique des données en centralisant toutes les informations collectées. De la même manière que Google ne stocke pas les pages web mais leurs métadonnées pour les référencer, les entreprises doivent également stocker les métadonnées de leurs données afin d'en faciliter l'exploitation et la découverte. Gartner le confirme dans son étude "catalogue de données is the New Black" : si les données de votre data lake sont sans métadonnées de gestion et de gouvernance, il sera considéré comme inefficace.

Grâce à ces nouveaux outils, les données deviennent un atout pour tous les employés. L'interface conviviale ne nécessite pas de compétences techniques et devient un moyen simple de connaître, d'organiser et de gérer ces données. Le catalogue de données devient l'outil collaboratif outil collaboratif de référence de référence dans l'entreprise.

Acquérir une vue d'ensemble de ces données et mettre en place une gouvernance données pour piloter les idées devient alors possible. des idées devient alors possible.

logo avatar actian

À propos d'Actian Corporation

Actian facilite l'accès aux données. Notre plateforme de données simplifie la façon dont les gens connectent, gèrent et analysent les données dans les environnements cloud, hybrides et sur site . Avec des décennies d'expérience dans la gestion des données et l'analyse, Actian fournit des solutions de de haute performance qui permettent aux entreprises de prendre des décisions basées sur les données. Actian est reconnu par les principaux analystes et a reçu des prix de l'industrie pour sa performance et son innovation. Nos équipes partagent des cas d'utilisation éprouvés lors de conférences (par exemple, Strata Data) et contribuent à des projets à code source ouvert. Sur le blog d'Actian, nous abordons des sujets tels que l'ingestion de données en temps réel, l'analyse de données, la gouvernance données, la gestion des données, la qualité des données, l'intelligence des données et l'analyse pilotée par l'IA.