Delphi: Hacia la ética y las normas de las máquinas

https://arxiv.org/abs/2110.07574

¿Qué se necesita para enseñar a una máquina a comportarse de forma ética? Aunque las normas éticas generales pueden parecer sencillas de enunciar ("no matarás"), aplicarlas a situaciones del mundo real es mucho más complejo. Por ejemplo, mientras que "ayudar a un amigo" es generalmente algo bueno, "ayudar a un amigo a difundir noticias falsas" no lo es. Identificamos cuatro desafíos subyacentes hacia la ética y las normas de las máquinas: (1) la comprensión de los preceptos morales y las normas sociales; (2) la capacidad de percibir situaciones del mundo real visualmente o leyendo descripciones en lenguaje natural; (3) el razonamiento de sentido común para anticipar el resultado de acciones alternativas en diferentes contextos; (4) lo más importante, la capacidad de hacer juicios éticos dada la interacción entre valores en competencia y su fundamento en diferentes contextos (por ejemplo, el derecho a la libertad de expresión frente a la prevención de la difusión de noticias falsas).

Nuestro trabajo comienza a abordar estas cuestiones dentro del paradigma del aprendizaje profundo. Nuestro modelo prototipo, Delphi, demuestra una gran promesa de razonamiento moral basado en el lenguaje, con una precisión de hasta el 92,1% comprobada por humanos. Esto contrasta fuertemente con el rendimiento del GPT-3 de 52,3%, lo que sugiere que la escala masiva por sí sola no dota a los modelos neurales de lenguaje preentrenados de valores humanos. Así pues, presentamos Commonsense Norm Bank, un libro de texto moral adaptado a las máquinas, que recopila 1,7 millones de ejemplos de juicios éticos de personas en un amplio espectro de situaciones cotidianas. Además de los nuevos recursos y rendimientos de referencia para futuras investigaciones, nuestro estudio proporciona nuevas ideas que conducen a varias cuestiones importantes de investigación abiertas: diferenciar entre los valores humanos universales y los valores personales, modelar diferentes marcos morales y enfoques explicables y coherentes para la ética de las máquinas.

*** Translated with www.DeepL.com/Translator (free version) ***


Comentarios

Popular

Es hora de que la IA se explique

Ann Cavoukian explica por qué la vigilancia invasiva no debería ser la norma en los entornos urbanos modernos y sostenibles

Gemelos digitales, cerebros virtuales y los peligros del lenguaje