¿QUÉ NECESITAMOS PARA CONSTRUIR SISTEMAS DE AI MÁS SOSTENIBLES?

https://greensoftware.foundation/articles/what-do-we-need-to-build-more-sustainable-ai-systems

Probablemente haya oído hablar de la intersección entre la inteligencia artificial (IA) y el medio ambiente. Sí, podemos crear soluciones de IA para abordar el cambio climático y otros problemas medioambientales. Pero los propios sistemas de IA tienen un impacto medioambiental. En este artículo hablaremos de esto último, sobre todo porque la escala de los sistemas de IA crece enormemente y corremos el riesgo de sufrir graves daños ambientales y sociales si no encontramos la manera de hacer que estos sistemas sean más ecológicos. No todas las esperanzas están perdidas en la incesante búsqueda de la construcción de sistemas más avanzados (SOTA); podemos hacer cambios para ayudar a mitigar el impacto ambiental. En concreto, la contabilidad del carbono puede ayudar a orientar nuestras acciones. De hecho, ¡hay cosas que podemos empezar a hacer esta semana que pueden ayudar! 


Contabilidad del carbono: una posible solución

En primer lugar, necesitamos conocer el impacto medioambiental de nuestros sistemas antes de poder realizar cambios. La contabilidad del carbono es una herramienta de diagnóstico esencial que puede ayudar a orientar nuestras acciones. No es en absoluto la solución completa, pero nos proporciona una base muy sólida para ponernos en marcha. Esto incluye cosas como cuándo ejecutar el entrenamiento de nuestros sistemas de IA, dónde ejecutarlos, y reunir esos conocimientos para evaluar los costes y beneficios de construir y desplegar dicho sistema. 


Entonces, ¿por qué la contabilidad del carbono para los sistemas de IA no es una práctica generalizada hoy en día? Es un campo incipiente con problemas en dos categorías: datos y práctica. 


Problemas actuales 

Problemas con los datos

En la actualidad, las fuentes de datos de entrada son muy poco ricas. Sólo unas pocas regiones del mundo disponen de conjuntos de datos bien surtidos y actualizados en tiempo real por proveedores como WattTime y ElectricityMap. En otros casos, nos quedamos con datos estáticos y gruesos en formatos a menudo no interoperables y no legibles por máquinas, procedentes de fuentes de datos gubernamentales. Esto impide que los que quieren modificar sus patrones de consumo de energía, como la programación de trabajos de entrenamiento de IA en períodos más verdes del día y en regiones del mundo, puedan obtener información procesable.


Esta falta de riqueza y de actualizaciones en tiempo real también tiene implicaciones para los lugares en los que las redes cuentan con fuentes de energía renovable conectadas, lo que ocurre cada vez más en muchas partes del mundo, ¡algo estupendo! Pero, dada su gran variabilidad -con qué intensidad brilla el sol y con qué fuerza sopla el viento-, la composición real de la energía de la red puede cambiar de forma imprevisible. Esto repercute en la capacidad de elegir regiones y periodos más verdes para ejecutar las cargas de trabajo computacionales. 


Por último, los datos publicados por los proveedores de computación en la nube, hasta ahora, no tienen la suficiente granularidad -al menos en los datos publicados públicamente- para permitir a los profesionales tomar decisiones independientes. Tienen que confiar en la información proporcionada por los propios proveedores de la nube para elegir los periodos y regiones adecuados para ejecutar las cargas de trabajo. Esto podría no ser malo, sobre todo porque los proveedores de la nube tienen los conocimientos más profundos sobre la composición real de la energía que consumen y, por tanto, sobre el impacto de las emisiones de carbono al ejecutar una carga de trabajo en un sistema concreto en la nube. 


Y todo esto se ve agravado por el hecho de que las diferentes metodologías de medición proponen diferentes métricas y formas de medir el impacto del carbono, junto con diferentes proxies cuando no se dispone de datos directos para evaluar el impacto del carbono de las cargas informáticas. Estas discrepancias dificultan las comparaciones y confunden al consumidor sobre qué soluciones son realmente más ecológicas.  


Por encima de todo, debemos considerar cómo todos los datos que se recopilen y utilicen cambiarán significativamente los comportamientos de los profesionales. Podemos reunir los conjuntos de datos más detallados del mundo y ofrecer análisis complejos, pero si eso no hace que los profesionales cambien su forma de diseñar, desarrollar e implantar los sistemas de IA, todo eso no sirve para nada.


Cuestiones prácticas

Si usted es un profesional, seguramente habrá detestado tener que escribir documentación y rellenar informes. La primera generación de herramientas para informar sobre el impacto del carbono de los sistemas de IA estaba plagada de una desconexión entre el modo de trabajar de los profesionales y lo que se les ofrecía como posibles soluciones. En concreto, estas herramientas solían implicar tener que visitar un sitio web, introducir información sobre el tipo de máquina virtual que utilizaban, la configuración que tenía, la región en la que se ejecutaba y el tiempo de ejecución del trabajo. Si el profesional no guardaba toda esa información, tenía que reconstruirla de memoria. O incluso si eran lo suficientemente diligentes como para ir y hacerlo justo después, se encontraban abandonando el esfuerzo después de unas cuantas ejecuciones. La razón: este enfoque les pedía que salieran de sus flujos de trabajo naturales. 

*** Translated with www.DeepL.com/Translator (free version) ***


Comentarios

Popular

Herramientas de Evaluación de Sistemas Algorítmicos

Sistemas multiagentes: Desafíos técnicos y éticos del funcionamiento en un grupo mixto

Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social