Sobre la dificultad de lograr la privacidad diferencial en la práctica: garantías a nivel de usuario en los datos de localización agregados

https://www.nature.com/articles/s41467-021-27566-0

Aunque los datos de movilidad humana a gran escala contienen información crucial para entender el comportamiento humano, también son muy sensibles. Google compartió con Bassolas et al. datos agregados anónimos de 300 millones de usuarios de Google Maps y declaró que compartir este conjunto de datos no plantea ningún problema de privacidad, ya que estos datos "en el mejor de los casos mejorarían el nivel de certeza [de un atacante para inferir si un usuario está en el conjunto de datos] sobre una conjetura aleatoria en aproximadamente un 16%". Creemos que estas garantías se basan en supuestos que no se cumplen en la práctica. Utilizando su modelo de ataque en un conjunto de datos de movilidad del mundo real, sostenemos en cambio que el nivel de certeza de su atacante es probablemente superior al 90% para un usuario típico (por ejemplo, el 95,4% para uno de los autores que realizó 32 viajes únicos en una semana). Los métodos de anonimización débiles y las garantías de privacidad poco realistas han erosionado la confianza del público en el pasado. A medida que se despliegan nuevos métodos de anonimización, debemos asegurarnos de que los riesgos y las garantías que ofrecen se comunican correctamente a los interesados.

Comentarios

Popular

Herramientas de Evaluación de Sistemas Algorítmicos

Sistemas multiagentes: Desafíos técnicos y éticos del funcionamiento en un grupo mixto

Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social