L’anonymisation est un sujet compliqué. Il existe des logiciels qui aide à rendre impossible la ré-identification est-ce que quelqu’un les a testés ?
J’ai listé mu-argus, tau-argus, arx et le package R qui peut avoir une interface sdcMicroGUI.
L’anonymisation est un sujet compliqué. Il existe des logiciels qui aide à rendre impossible la ré-identification est-ce que quelqu’un les a testés ?
J’ai listé mu-argus, tau-argus, arx et le package R qui peut avoir une interface sdcMicroGUI.
C’est très complexe. Quand on développe un logiciel d’anonymisation, il faut tenir compte de plusieurs problèmes
Une alternative est d’anonymiser ‹ à la volée › ce qui est retourné à l’utilisateur, mais cela demande un gros travail de conception…
Bonjour,
La difficulté concerne aussi l’environnement d’anonymisation que vous souhaité traiter. Même si vous anonymisez une base et que vous en mettez à disposition une autre également anonymisée, il faut traiter l’anonymisation des deux, dans le cas de données publiques.
Tau Argus est simple et agréable pour des petits traitements.
« Difficile » plutôt qu’« impossible »: la réidentification est toujours un risque
Ex: http://bits.blogs.nytimes.com/2015/01/29/with-a-few-bits-of-data-researchers-identify-anonymous-people/?_r=0
Bien sûr que c’est toujours un risque !
Je retiens ce passage de l’article cité par Lancelot :
“The message is that we ought to rethink and reformulate the way we think about data protection,” said Yves-Alexandre de Montjoye, a graduate student in computational privacy at the M.I.T. Media
Parce que dans les exemples cités, la prise en compte du risque de ré-identification avait été tout de même assez naïve.
Sur la question du multi-source je suis preneur tout élément. Pour l’instant j’en ai trouvé très peu.