Quelles sont les solutions d'anonymisation ?

De wikidatamarketing
Sauter à la navigation Sauter à la recherche


La législation et les pratiques des utilisateurs montrent un intérêt grandissant pour la protection des données personnelles, obligeant les entreprises de tout secteur à se conformer aux exigences de protection et de collecte des données personnelles. Pour renforcer la sécurité, différentes techniques d’anonymisation et de pseudonymisation existent. L’anonymisation totale étant encore difficile à atteindre, l’objectif premier est de protéger au maximum les données des individus et de réduire le plus possible les risques de fuite de données et de ré-identification. Cet article se concentre sur le cas des acteurs du numérique et de tous les organismes utilisant des flux numériques.

Pourquoi anonymiser les données personnelles ?

En tant qu’utilisateur, nous “semons” des données personnelles partout et notamment sur Internet : nom, adresse postale, coordonnées bancaires, identifiants de connexion, adresses e-mail... Une donnée personnelle est une donnée permettant une identification directe ou indirecte d’une personne physique ou morale.

Le Règlement Général sur la Protection des Données (RGPD) a porté le sujet de la protection des données personnelles sur le devant de la scène. Des initiatives individuelles montrent également que ce sujet est toujours plus important pour les utilisateurs et internautes. Ces initiatives individuelles se traduisent sur Internet notamment par l’utilisation grandissante de bloqueurs publicitaires ou adblockers, bloquant non seulement les publicités mais aussi tous types de traceurs et d’outils d’analyse d’audience.

Les acteurs du numérique sont donc forcés à traiter les données de manière exemplaire sous peine de lourdes sanctions. Cela passe par un recueil de consentement dans les règles pour toute collecte de données personnelles et par l’anonymisation de ces données.

Anonymisation, pseudonymisation : quelles techniques utiliser ?

● Anonymiser une donnée consiste à en modifier le contenu ou la structure afin de rendre impossible l’identification des individus concernés par cette donnée.

● Anonymisation et pseudonymisation sont deux termes souvent utilisés pour exprimer la même idée alors qu’une différence importante existe : la réversibilité. S’il est possible de ré-identifier l’individu de base à l’aide d’une clé de déchiffrement, d’une table pivot ou de croisement de données, il ne s’agit pas d’anonymisation, ce terme s’appliquant uniquement à une transformation irréversible de la donnée.


Quelques exemples de solutions techniques :

  • Suppression : supprimer totalement les données
  • Effacement : remplacer les données par des blancs ou des symboles (XXX)
  • Troncature : conserver uniquement quelques caractères d’une donnée
  • Substitution : remplacer les données source par des données de même forme
  • Pseudonymisation : attribuer un pseudonyme ou un ID correspondant aux données
  • Chiffrement : remplacer la valeur d’origine par une valeur illisible sans la clé de déchiffrement
  • Hachage ou calcul d'empreinte utilisé pour valider des données sans y avoir accès en clair

Pour une anonymisation complète, vous ne devez pas conserver les clés de déchiffrement ou tout autre outil qui vous permettrait de revenir à la donnée initiale.

Pour mettre en place ces différentes solutions techniques, il sera nécessaire de les développer en interne ou d’avoir recours à des solutions externes comme par exemple Oracle Data Masking , IBM InfoSphere Optim Data Privacy , Informatica Data Masking solutions...


Des solutions efficaces ?

Dans les faits, l’anonymisation est encore difficile à atteindre. Forte technicité, peu d’acteurs spécialisés sur ce sujet, coûts importants et risque réel de ré-identification difficile à évaluer sont autant de freins à l’anonymisation. Avec de grands moyens, il est souvent possible de ré-identifier une donnée et de la rattacher à un individu.

Pour déterminer si une personne physique est identifiable, vous devez évaluer votre solution en examinant trois critères clés :

  • l’individualisation (est-il toujours possible d’isoler un individu ?)
  • la corrélation (est-il possible de relier entre eux des ensembles de données distincts concernant un même individu ?)
  • l’inférence (peut-on déduire de l’information sur un individu ?)

Selon la Commission Nationale Informatique et Libertés (CNIL), un ensemble de données pour lequel au moins un de ces trois critères n’est pas respecté ne pourra être considéré comme anonyme qu’à la suite d’une analyse détaillée des risques de ré-identification.

Sources :

1. Anonymisation des données sur blog.ippon.fr

2. Règlement Général sur la Protection des Données (RGPD) Raison 26

3. Le G29 publie un avis sur les techniques d’anonymisation sur CNIL.fr

4. 10 Best Data Masking Tools And Software In 2019

Cette définition vous a été donnée par Chloé Barrault de la société AdBack membre de l’association CPA.