Demasiados investigadores de IA piensan que los problemas del mundo real no son relevantes

https://www-technologyreview-com.cdn.ampproject.org/c/s/www.technologyreview.com/2020/08/18/1007196/ai-research-machine-learning-applications-problems-opinion/amp/

Cualquier investigador que se haya centrado en aplicar el aprendizaje automático a problemas del mundo real probablemente haya recibido una respuesta como ésta: "Los autores presentan una solución para un problema original y muy motivador, pero es una aplicación y la importancia parece limitada para la comunidad del aprendizaje automático".


Estas palabras proceden directamente de una reseña que recibí por un artículo que presenté en la conferencia NeurIPS (Neural Information Processing Systems), un lugar destacado para la investigación sobre el aprendizaje automático. He visto este estribillo una y otra vez en las reseñas de los trabajos en los que mis coautores y yo presentamos un método motivado por una aplicación, y he escuchado historias similares de innumerables personas.


Publicidad


Esto me hace preguntarme: Si la comunidad considera que el objetivo de resolver problemas de alto impacto en el mundo real con el aprendizaje automático tiene una importancia limitada, entonces ¿qué estamos tratando de lograr?


El objetivo de la inteligencia artificial (pdf) es hacer avanzar la frontera de la inteligencia de las máquinas. En el campo del aprendizaje automático, un desarrollo novedoso suele significar un nuevo algoritmo o procedimiento, o -en el caso del aprendizaje profundo- una nueva arquitectura de red. Como otros han señalado, este hiperenfoque en los métodos novedosos conduce a una plaga de artículos que informan de mejoras marginales o incrementales en conjuntos de datos de referencia y exhiben una erudición defectuosa (pdf), ya que los investigadores compiten para alcanzar la cima.


Mientras tanto, muchos artículos que describen nuevas aplicaciones presentan tanto conceptos novedosos como resultados de gran impacto. Pero incluso la palabra "aplicación" parece estropear el artículo para los revisores. En consecuencia, este tipo de investigaciones quedan marginadas en los principales congresos. La única esperanza real de sus autores es que sus trabajos sean aceptados en talleres, que rara vez reciben la misma atención de la comunidad.


Esto es un problema porque el aprendizaje automático es muy prometedor para el avance de la salud, la agricultura y los descubrimientos científicos, entre otros. La primera imagen de un agujero negro se produjo gracias al aprendizaje automático. Las predicciones más precisas de las estructuras de las proteínas, un paso importante para el descubrimiento de fármacos, se realizan mediante el aprendizaje automático. Si otros en este campo hubieran dado prioridad a las aplicaciones en el mundo real, ¿qué otros descubrimientos innovadores habríamos hecho ya?


No se trata de una revelación nueva. Citando un artículo clásico titulado "Machine Learning that Matters" (pdf), del informático de la NASA Kiri Wagstaff "Gran parte de la investigación actual sobre aprendizaje automático ha perdido su conexión con problemas de importancia para el mundo más amplio de la ciencia y la sociedad". El mismo año en que Wagstaff publicó su artículo, una red neuronal convolucional llamada AlexNet ganó un concurso de alto perfil para el reconocimiento de imágenes centrado en el popular conjunto de datos ImageNet, lo que llevó a una explosión de interés en el aprendizaje profundo. Por desgracia, la desconexión que describió parece haber empeorado aún más desde entonces.


Las preguntas equivocadas

Marginar la investigación de las aplicaciones tiene consecuencias reales. Los conjuntos de datos de referencia, como ImageNet o COCO, han sido clave para el avance del aprendizaje automático. Permiten entrenar y comparar algoritmos con los mismos datos. Sin embargo, estos conjuntos de datos contienen sesgos que pueden incorporarse a los modelos resultantes.


Más de la mitad de las imágenes de ImageNet (pdf) proceden de Estados Unidos y Gran Bretaña, por ejemplo. Este desequilibrio hace que los sistemas clasifiquen de forma inexacta las imágenes en categorías que difieren según la geografía (pdf). Los conjuntos de datos de rostros más conocidos, como la base de datos de rostros de AT&T, contienen principalmente sujetos masculinos de piel clara, lo que hace que los sistemas tengan dificultades para reconocer rostros femeninos y de piel oscura.



*** Translated with www.DeepL.com/Translator (free version) ***


Comentarios

Popular

Herramientas de Evaluación de Sistemas Algorítmicos

Sistemas multiagentes: Desafíos técnicos y éticos del funcionamiento en un grupo mixto

Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social