El web scraping es una herramienta, no un crimen

 Como reportero que puede codificar, puedo recopilar fácilmente información de sitios web y cuentas de redes sociales para encontrar historias. Todo lo que necesito hacer es escribir algunas líneas de código que ingresen al éter, abrir sitios web y descargar los datos que ya están disponibles públicamente en ellos. Este proceso se llama raspado.


Pero hay un cálculo que hago en mi cabeza cada vez que comienzo a buscar una historia que requiere raspar: "¿Vale la pena ir a prisión por esta historia?"


No estoy hablando de piratear las bases de datos amuralladas de la CIA. Me refiero al uso de un script para recopilar información a la que puedo acceder como consumidor diario de Internet, como publicaciones públicas de Instagram o tweets que usan un determinado hashtag.


Historia relacionada


Las compañías farmacéuticas no deberían ser favoritas al otorgar acceso a tratamientos experimentales de covid-19

La ley, no la fama o el poder, debería determinar quién puede probar medicamentos no aprobados fuera de los ensayos clínicos.


Mi preocupación no es infundada. Una ley estadounidense vagamente escrita llamada Ley de Abuso y Fraude Informático convierte el acceso a este tipo de información de manera programática en un delito potencial. La ley, que data de hace décadas, se introdujo después de que los legisladores vieron la película WarGames de 1983 y decidieron que Estados Unidos necesitaba una ley contra la piratería que prohíbe a cualquier persona usar una computadora "sin autorización o sin exceder el acceso autorizado".


Si bien la ley puede haber tenido buenas intenciones y se ha utilizado para enjuiciar a las personas que descargan cosas de sus sistemas de trabajo que se supone que no deben hacerlo, también atrapa a muchas otras personas en su red ampliamente difundida, incluidos académicos, investigadores, y periodistas.


¿Qué significa "exceder el acceso autorizado" en la era de las redes sociales? ¿Un empleado que tiene acceso a una base de datos de revistas de investigación para el trabajo y las usa para fines privados excede el acceso autorizado? ¿Comete un delito una reportera como yo que recopila información mediante procesos automatizados y su propia cuenta de Facebook?


Hasta ahora, las interpretaciones de la ley han variado de un caso judicial a otro, confiando en varios jueces para darnos una mejor definición de lo que significa exactamente exceder el acceso autorizado a la información. Pero pronto la Corte Suprema de Estados Unidos se pronunciará sobre la ley por primera vez, en el caso Van Buren v. Estados Unidos. Nathan Van Buren, un oficial de policía, tenía acceso a bases de datos confidenciales para trabajar y vendía la información que buscaba allí a un tercero. El tribunal escuchó los argumentos iniciales el 30 de noviembre y podría anunciar su decisión cualquier día.



Desde precios injustos en Amazon hasta discursos de odio en Facebook, muchas fechorías corporativas se pueden rastrear a través de las plataformas en las que llevamos a cabo gran parte de nuestras vidas. Y la vasta huella digital que los seres humanos producen en línea, gran parte de la cual está disponible públicamente, puede ayudarnos a reparar las lagunas de datos e investigar áreas que de otro modo serían difíciles de entender.


Como señaló la artista y experta en tecnología Mimi Onuoha en su conmovedora pieza The Library of Missing Datasets:


Lo que ignoramos revela más de lo que prestamos atención. Es en estas cosas donde encontramos indicios culturales y coloquiales de lo que se considera importante. Los espacios que hemos dejado en blanco revelan nuestros prejuicios e indiferencias sociales ocultos.

La recopilación de datos es costosa y engorrosa, pero también es una herramienta importante para descubrir y revelar injusticias sistémicas. Qué datos consideramos lo suficientemente importantes para recopilar es un asunto que a menudo se deja en manos de entidades poderosas, gobiernos y corporaciones, que no siempre tienen en cuenta a las personas más vulnerables de la sociedad.


Si los funcionarios del gobierno chino no publican información sobre los campos donde están detenidas las minorías musulmanas, entonces quizás los investigadores puedan usar la información de los mapas de Google para aproximar el alcance de este problema. Si los perpetradores no admiten los crímenes de guerra, pero publican sobre ellos en las redes sociales, los fiscales y los investigadores de derechos humanos aún pueden construir casos en su contra.

https://www.technologyreview.com/2020/12/08/1013440/web-scraping-van-buren-case-supreme-court-opinion/

Comentarios

Popular

Herramientas de Evaluación de Sistemas Algorítmicos

Sistemas multiagentes: Desafíos técnicos y éticos del funcionamiento en un grupo mixto

Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social