Pourquoi une approche de la protection de la vie privée dès la conception fonctionne-t-elle pour les catalogues de données ?
Actian Corporation
11 avril 2022

Depuis le début du 21e siècle, nous vivons une véritable révolution numérique. Le monde se numérise en permanence et l'activité humaine se structure de plus en plus autour des données et des services en réseau. Les industries manufacturières, de loisirs, administratives, de services, médicales et tant d'autres sont désormais organisées autour de systèmes d'information complexes et interconnectés. Ainsi, de plus en plus de données sont continuellement collectées par les appareils et technologies présents dans notre quotidien (Web, Smartphone, IoT) et transitent d'un système à l'autre. Il est devenu central pour toute entreprise qui fournit des produits ou des services de tout mettre en œuvre pour protéger les données de ses clients. La meilleure approche pour y parvenir est celle du Privacy by Design.
Dans cet article, nous expliquons ce qu'est le Privacy by Design, comment nous avons appliqué cette approche dans la conception de notre catalogue de données, et comment un catalogue de données peut aider les entreprises à mettre en œuvre le Privacy by Design.
Protection des données : Une question clé pour les entreprises
Parmi les différentes données mentionnées ci-dessus, certaines permettent d'identifier directement ou indirectement des personnes physiques. Il s'agit des données à caractère personnel, telles que définies par la CNIL. Elles revêtent une importance capitale dans le monde moderne en raison de leur valeur intrinsèque.
Au quotidien, d'énormes volumes de données personnelles transitent entre les individus, les entreprises et les gouvernements. Le risque de leur utilisation abusive est réel, comme l'a montré par exemple le scandale Cambridge Analytica en 2015 . Les cybercriminels peuvent également en tirer des gains substantiels, via le piratage de comptes, la revente de données à d'autres cybercriminels, l'usurpation d'identité, ou l'attaque d'entreprises via des escroqueries au phishing ou au président. Par exemple, un promoteur immobilier s'est récemment fait dérober plusieurs dizaines de millions d'euros en France.
La nécessité de protéger les données n'a jamais été aussi importante.
Les États ont rapidement pris conscience de cet enjeu pour protéger les individus des dérives liées à l'exploitation de leurs données. En Europe, par exemple, le GDPR (le règlement général sur la protection des données) est en vigueur depuis 2016 et est déjà bien ancré dans les activités quotidiennes des entreprises. Dans le reste du monde, les réglementations sont en constante évolution et concernent presque tous les pays. Récemment, la Californie a adopté une loi sur la confidentialité des données des consommateurs, un équivalent américain du GDPR. Même la Chine vient de légiférer sur ce sujet.
La protection de la vie privée dès la conception : Définir un concept clé pour la protection des données
Alors que de nombreuses législations s'appuient fortement sur la notion de Privacy by Design, celle-ci a été conceptualisée par Ann Cavoukian à la fin des années 1990, alors qu'elle était commissaire à l'information et à la protection de la vie privée de la province de l'Ontario, au Canada. L'essence de cette idée est d'inclure la question de la protection des données personnelles dès la conception d'un système informatique.
En ce sens, Privacy by Design énumère sept principes fondamentaux :
La proactivité : Toute entreprise doit mettre en place les dispositions nécessaires à la protection des données en amont, et ne doit pas se contenter d'une politique réactive ;
Protection des données personnelles par défaut : Tout système doit adopter par défaut le niveau de protection le plus élevé possible pour les données sensibles de ses utilisateurs ;
Le respect de la vie privée dès la conception : Le respect de la vie privée devrait être un aspect systématiquement étudié et pris en compte lors de la conception et de la mise en œuvre de nouvelles fonctionnalités ;
Fonctionnalité totale : Aucun compromis ne doit être fait avec les protocoles de sécurité ou avec l'expérience de l'utilisateur ;
Sécurité de bout en bout : Le système doit assurer la sécurité des données tout au long de leur cycle de vie, de la collecte à la destruction (y compris si les données sont externalisé) ;
Visibilité et transparence : Le système et l'entreprise doivent documenter et communiquer les procédures de protection des données à caractère personnel et les mesures prises de manière claire, cohérente et transparente ;
Respect de la vie privée de l'utilisateur : Chaque décision de conception et de mise en œuvre doit être prise en tenant compte des intérêts de l'utilisateur.
L'application du principe de respect de la vie privée dès la conception
Nous avons construit notre produit sur les fondements du principe de la protection de la vie privée dès la conception.
Traitement des données personnelles des utilisateurs
Tout d'abord, nous avons ancré la protection des données au cœur de notre architecture. Les données de chacun de nos clients sont séparées dans différents locataires, chacun étant crypté avec sa propre clé. L'authentification de l'utilisateur est gérée par un système tiers spécialisé. Nous encourageons la fédération d'identité parmi nos clients, ce qui leur permet de garder le contrôle sur les données nécessaires à l'identification et à l'authentification de l'utilisateur .
Nous avons également intégré le concept de "Privacy by Design" dans la conception de notre application. Par exemple, nous ne collectons que le strict minimum d'informations et tous les résultats du système sont anonymisés (journaux, erreurs d'application, API).
Traitement des données commerciales des clients
Notre mission principale étant de documenter les données, notre solution contient par essence des métadonnées. Par conception, l'Actian Data Intelligence Platform n'extrait aucune donnée des systèmes de nos clients. En effet, le risque est intrinsèquement moins sur les métadonnées que sur les données.
Néanmoins, nous offrons au sein de la plateforme, plusieurs fonctionnalités permettant de fournir des informations sur les données présentes dans les systèmes du client (statistiques, échantillonnage, etc.). Grâce à notre architecture, les calculs sont toujours effectués sur l'infrastructure du client, au plus près des données et de leur sécurité. Et conformément au principe n°2 du Privacy by Design, nous avons défini la protection des données personnelles comme un paramètre par défaut. Ainsi, toutes ces fonctionnalités sont désactivées par défaut et ne peuvent être activées que par le client.
Comment notre catalogue de données aide les entreprises à mettre en œuvre la protection de la vie privée dès la conception (Privacy by Design)
Notre catalogue de données peut aider votre entreprise à mettre en œuvre le principe de la protection de la vie privée dès la conception (Privacy by Design), en particulier en ce qui concerne les aspects de contrôle et de vérification. Si l'on reprend les 7 principes décrits précédemment, le catalogue de données peut participer efficacement à deux d'entre eux : le principe de visibilité et de transparence, et le principe de sécurité de bout en bout. Le catalogue de données permet également d'automatiser l'identification des données sensibles.
Visibilité et transparence grâce au catalogue de données
L'objectif d'un catalogue de données est de centraliser les données d'une entreprise, de les documenter et de les partager avec le plus grand nombre de personnes possible. Cette centralisation permet à chaque employé de savoir quelles sont les données collectées par le CRM, et aux équipes marketing et customer success de traiter ces informations dans les rapports d'acquisition et de suivi du churn.
Une fois cet inventaire établi, le catalogue peut être utilisé pour documenter certaines informations complémentaires nécessaires au bon fonctionnement de l'entreprise. C'est notamment le cas du caractère sensible ou non des informations documentées, des règles de gouvernance, des traitements ou des procédures d'accès à appliquer.
Dans le cadre d'une approche Privacy by Design, le catalogue de données peut être utilisé pour ajouter un terme métier correspondant à une donnée sensible (un numéro de sécurité sociale, un numéro de téléphone, etc.) Ce terme métier peut ensuite être facilement associé aux tables ou champs physiques qui contiennent les données, ce qui permet de les identifier facilement. Cette initiative contribue au principe de visibilité et de transparence du Privacy by Design.
Sécurité de bout en bout grâce au catalogue de données
Le catalogue de données offre également des fonctionnalités de lignage des données. Le lignage automatique des données garantit que les processus appliqués aux données identifiées comme sensibles sont conformes à ce qui est défini par la gouvernance données de l'entreprise. Il est alors simple avec le catalogue de données de remplir les règles de gouvernance à appliquer aux données sensibles.
De plus, le lineage permet de suivre l'ensemble du cycle de vie des données, depuis leur création jusqu'à leur utilisation finale, en passant par leurs transformations. Il est ainsi facile de vérifier que toutes les étapes de ce cycle de vie sont conformes aux règles et de corriger les éventuelles erreurs.
Le catalogue de données, par le biais de la lignée de données, contribue donc au principe de la sécurité de bout en bout du Privacy by Design.
Cela dit, nous restons convaincus qu'un catalogue de données n'est pas une solution de conformité, mais plutôt un outil d'acculturation des équipes aux données sensibles et à leurs particularités d'utilisation.
Identification desdonnées sensibles via le catalogue de données
Dans un environnement de données en évolution rapide, le catalogue de données doit refléter le plus possible la réalité afin de conserver la confiance de ses utilisateurs. Sans cela, c'est toute l'adoption du projet de catalogue de données qui est remise en cause.
Nous sommes fermement convaincus que le catalogue de données doit être automatisé autant que possible pour être évolutif et efficace. Cela commence par l'inventaire des données disponibles. En ce sens, notre inventaire est automatisé et se charge de répercuter toutes les modifications du système d'origine (source) des données directement dans le catalogue. Ainsi, à tout moment, le client dispose d'une liste exhaustive des données présentes dans ses systèmes.
Et pour aider nos clients à identifier les données inventoriées qui méritent un traitement spécial en raison de leur statut de données sensibles, l'automatisation ne s'arrête pas à l'inventaire. Nous proposons désormais un système qui suggère le marquage des nouvelles données inventoriées avec un profil de données sensibles. Il est ainsi plus facile de mettre ces données en avant et de diffuser l'information plus rapidement et plus facilement au sein de l'entreprise.
Conclusion
Ces dernières années, les données personnelles sont devenues une véritable préoccupation pour la plupart des consommateurs. De plus en plus de pays mettent en place des réglementations pour garantir à leurs citoyens une protection maximale. L'un des grands principes qui régit l'ensemble de ces réglementations est le Privacy by Design.
Nous avons dès le départ inclus la réflexion autour des données personnelles au cœur de notre produit. Tant dans notre développement technique que dans le traitement des données de nos utilisateurs, ainsi que dans notre réflexion sur les données que nos clients traitent via notre catalogue.
Nous pensons qu'un catalogue de données peut être un atout important dans la mise en œuvre et le suivi des politiques de Privacy by Design. Nous comptons également beaucoup sur l'automatisation et l'IA pour apporter de nombreuses autres améliorations dans les mois à venir : construction automatique du lignage des données techniques, amélioration de la détection des données sensibles dans les objets du catalogue pour mieux les documenter, contrôle de la qualité des traitements appliqués aux données sensibles, etc. Les possibilités sont nombreuses.
Pour en savoir plus sur les avantages du catalogue dans la gestion de vos données sensibles et personnelles, n'hésitez pas à prendre rendez-vous avec l'un de nos experts.
S'abonner au blog d'Actian
Abonnez-vous au blogue d'Actian pour recevoir des renseignements sur les données directement à vous.
- Restez informé - Recevez les dernières informations sur l'analyse des données directement dans votre boîte de réception.
- Ne manquez jamais un article - Vous recevrez des mises à jour automatiques par courrier électronique pour vous avertir de la publication de nouveaux articles.
- Tout dépend de vous - Modifiez vos préférences de livraison en fonction de vos besoins.