Cómo nuestros datos codifican el racismo sistemático
A menudo me han dicho: "Los datos no mienten". Sin embargo, esa nunca ha sido mi experiencia. Para mí, los datos casi siempre mienten. Los resultados de búsqueda de imágenes de Google para "piel sana" muestran solo mujeres de piel clara, y una consulta sobre "chicas negras" todavía arroja pornografía. El conjunto de datos de caras de CelebA tiene etiquetas de "nariz grande" y "labios grandes" que se asignan de manera desproporcionada a rostros femeninos de piel más oscura como la mía. Los modelos entrenados por ImageNet me etiquetan como una "mala persona", un "adicto a las drogas" o un "fracasado". A los conjuntos de datos para detectar el cáncer de piel les faltan muestras de tipos de piel más oscuros. La supremacía blanca a menudo aparece violentamente, en disparos en un Walmart abarrotado o en un servicio religioso, en el comentario agudo de una acusación alimentada por el odio o un empujón en la calle...