Éthique et intégration des données
Je collectionne des articles sur l'intégration de données. Je le fais à la fois pour continuer à me former et pour découvrir des points de vue nouveaux et intéressants sur une technologie avec laquelle je travaille depuis le début des années 90.
L'un des articles les plus stimulants est un texte récent d'AnneBuff, qui aborde les questions éthiques liées aux données, notamment le big data et l'intégration des données. « L'introduction des réseaux sociaux issues réseaux sociaux et du big data dans les domaines de l'intégration des données et gestion des données de référence a suscité beaucoup d'engouement. Après tout, une quantité accrue de données – capable de nous aider à mieux identifier et comprendre nos clients – n'est-elle pas inestimable pour l'entreprise ? Peut-être, mais cette valeur infinie pourrait s'accompagner de coûts et de responsabilités considérables et tout à fait inattendus si ces données ne sont pas gérées de manière appropriée. »
Comme le souligne Anne, lorsque nous intégrons des sources de données externes à d’autres sources, nous devons bien sûr tenir compte des lois et réglementations en vigueur concernant le traitement de ces données. Ce qui fait toutefois défaut, c’est une compréhension de la responsabilité en matière de gestion des données une perspective éthique. Nous devons veiller à ne causer aucun préjudice lorsque nous conservons et exploitons des données provenant de nombreuses sources différentes, y compris les nôtres. « Nous voyons de plus en plus souvent dans l'actualité des cas où des entreprises se retrouvent confrontées à des situations qui nuisent à leur image de marque, simplement parce qu'elles n'ont pas pris en compte les implications éthiques de leurs actions. »
La plupart d'entre nous ne réfléchissons pas à la responsabilité éthique liée à l'intégration des données et à leur utilisation en général. De nos jours, détenir des données, c'est détenir la connaissance ; détenir la connaissance, c'est détenir le pouvoir ; et détenir le pouvoir, c'est s'exposer à un risque d'abus.
L'intégration des données a toujours été un outil puissant pour favoriser la compréhension, généralement au sein même de l'entreprise. En mettant en place des applications et des bases de données qui partagent leurs données, les entreprises peuvent agir sur la base d'informations quasi parfaites.
Par exemple, la capacité d’un système de gestion des commandes à vérifier la solvabilité d’un client et à ajuster dynamiquement le prix en fonction du risque de non-paiement. De plus, la capacité des informations commerciales à signaler automatiquement aux systèmes de production de lancer la fabrication et la livraison d’un produit, puis à transmettre ces informations à la comptabilité, et éventuellement à un entrepôt de données. Tout cela se déroule en quelques secondes. À l’époque, on appelait cela « l’entreprise en temps réel ».
Nous vous présentons aujourd'hui quelques nouveaux concepts qui renforcent encore davantage la puissance des données, notamment :
- L'essor des systèmes de mégadonnées qui permettent d'analyser facilement des données structurées et non structurées avec des temps de réponse rapides.
- Une technologie d'intégration évolutif plus performante et plus évolutif , capable de répliquer les données entre différents systèmes et bases de données.
- L'essor des données provenant de nombreuses sources différentes et hébergées dans le cloud, notamment réseaux sociaux, les administrations publiques et les entreprises.
- Une volonté croissante d'exploiter ces informations pour augmenter le chiffre d'affaires.
Ainsi, une entreprise bien intégrée peut effectivement avoir accès à de nombreuses sources de données différentes, tant en interne qu'en externe. La capacité à consulter ces données et à les replacer dans leur contexte offre des informations qui n'étaient pas disponibles auparavant, comme la possibilité de déterminer des caractéristiques personnelles, même en l'absence de données directes, telles que l'état civil, l'orientation sexuelle, les revenus, le casier judiciaire, les opinions politiques, la solvabilité, les loisirs, les affiliations, etc.
Une grande partie de ces données provient d'informations en apparence anodines, comme le fait de publier une photo de sa nouvelle moto sur Facebook ou d'exprimer son support mariage gay sur Twitter. Même si vous ne diffusez pas ces informations sur les réseaux sociaux, il est possible de tirer certaines conclusions en fonction des personnes que vous autorisez à faire partie de vos cercles sociaux virtuels, ou en suivant les déplacements de votre smartphone. La capacité à tirer ces conclusions à partir des données est le concept central de la science des données, une discipline en plein essor.
D'autres analyses de données plus sophistiquées et axées sur le monde des affaires sont également possibles. On peut citer, par exemple, la capacité à déterminer si une entreprise atteindra ses objectifs trimestriels en s'appuyant sur des milliers de données disparates, puis à tirer profit de ces informations. Ou encore, les autorités publiques peuvent utiliser les données recueillies par les systèmes GPS des automobilistes pour délivrer des contraventions pour excès de vitesse. La liste est longue.
Quelles sont donc les questions éthiques liées à l'utilisation des données et à leur collecte à l'aide de technologies et d'approches d'intégration des données ? Comme nous l'avons vu plus haut, les données sont source de savoir, le savoir est source de pouvoir, et le pouvoir implique des responsabilités.
À mesure que nous apprenons à exploiter les données pour mieux comprendre celles que nous gérons, ainsi qu'à tirer parti d'autres données externes pour définir un contexte plus précis, nous devons nous poser la question suivante : que devons-nous réellement comprendre pour support ? Quelles informations sont pertinentes ? Quelles sont les implications juridiques liées à la gestion de certaines données ? Quelles informations sont trop intrusives ?
Cela ne signifie pas pour autant que nous nous contentons de protéger l'entreprise contre les critiques ou d'éviter les problèmes de relations publiques. Il s'agit d'un ensemble de principes fondamentaux qui régissent l'utilisation d'informations devenues bien plus complètes et détaillées qu'il y a encore quelques années. Il s'agit de l'utilisation éthique des données et de la capacité à continuer de tirer parti des approches et des technologies d'intégration des données dans l'intérêt de l'entreprise.