Todo el mundo debería decidir cómo se utilizan sus datos digitales, no sólo las empresas tecnológicas
https://www.nature.com/articles/d41586-021-01812-3
Hace unas décadas, si un investigador quería saber cómo afectaba el mal tiempo a los desplazamientos al trabajo -los medios de transporte que utiliza la gente, las rutas que toma, las horas en que viaja- podría haber encuestado a cientos de personas y contado los coches, autobuses y bicicletas en los principales cruces.
Hoy en día es posible acceder a datos sobre los desplazamientos de millones de personas, tomados de rastreadores de localización en teléfonos o vehículos, a veces en tiempo real. Estos datos pueden combinarse con los análisis de las vacunas COVID-19 para investigar los efectos de los viajeros que regresan a la oficina. Y los datos meteorológicos pueden incorporarse para determinar si ahora hay más gente que trabaja desde casa cuando llueve mucho que hace unos años.
En teoría. La realidad suele estar muy lejos de esta visión de color de rosa.
La mayoría de los datos de los que disponen -o que buscan- los científicos sociales computacionales hoy en día se generan para responder a preguntas que no tienen nada que ver con su investigación. Los datos llevan la marca de su propósito original, ya sea la publicidad dirigida o las primas de seguros personalizadas. Estos datos pueden reutilizarse con cautela para responder a otras preguntas -los rastreadores de fitness portátiles podrían servir de base para los estudios sobre la obesidad, por ejemplo-, pero suelen quedar lagunas cruciales. En consecuencia, los científicos suelen recurrir a soluciones provisionales para sacar provecho de lo que pueden obtener1.
Comentarios
Publicar un comentario