Las empresas de tecnología están capacitando a la inteligencia artificial para leer tus labios

https://www.vice.com/en/article/bvzvdw/tech-companies-are-training-ai-to-read-your-lips

Un paciente se sienta en una cama de hospital, un vendaje cubre su cuello con una pequeña abertura para el tubo de traqueotomía que le suministra oxígeno.


Debido a su cirugía reciente, el hombre que aparece en este video de marketing no puede vocalizar. Entonces, un médico sostiene un teléfono inteligente y registra al paciente mientras pronuncia una frase corta. Una aplicación llamada SRAVI analiza los movimientos de los labios y en unos dos segundos devuelve su interpretación: "Necesito succión".


ANUNCIO PUBLICITARIO


Parece una interacción simple y, en algunos aspectos, SRAVI (aplicación de reconocimiento de voz para personas con problemas de voz) sigue siendo bastante simplista. Solo puede reconocer unas pocas docenas de frases, y lo hace con aproximadamente un 90 por ciento de precisión. Pero la aplicación, creada por la startup irlandesa Liopa, representa un gran avance en el campo del reconocimiento visual de voz (VSR), que implica entrenar a la IA para leer los labios sin ninguna entrada de audio. Es probable que sea la primera aplicación de inteligencia artificial para lectura de labios disponible para la compra pública.


Los investigadores han estado trabajando durante décadas para enseñar a las computadoras a leer los labios, pero ha demostrado ser una tarea desafiante incluso con los avances en los sistemas de aprendizaje profundo que han ayudado a resolver otros problemas históricos. La investigación ha sido impulsada por una amplia gama de posibles aplicaciones comerciales, desde herramientas de vigilancia hasta aplicaciones de comunicación silenciosa y un rendimiento mejorado del asistente virtual.


Liopa está en el proceso de certificar SRAVI como un dispositivo médico de Clase I en Europa, y la compañía espera completar la certificación en agosto, lo que le permitirá comenzar a vender a proveedores de atención médica.


Si bien sus intenciones para la tecnología no están claras, muchos de los gigantes tecnológicos también están trabajando en la inteligencia artificial para leer los labios. Los científicos afiliados o que trabajan directamente para Google, Huawei, Samsung y Sony están investigando sistemas VSR y parecen estar haciendo rápidos avances, según entrevistas y revisión de Motherboard de investigaciones y solicitudes de patentes recientemente publicadas. Las empresas no respondieron o rechazaron entrevistas para esta historia.


ANUNCIO PUBLICITARIO


A medida que la IA de lectura de labios emerge como un producto comercial viable, los tecnólogos y los perros guardianes de la privacidad están cada vez más preocupados por cómo se está desarrollando y cómo podría implementarse algún día. SRAVI, por ejemplo, no es la única aplicación de inteligencia artificial para lectura de labios en la que está trabajando Liopa. La compañía también se encuentra en la fase dos de un proyecto con una agencia de investigación de defensa del Reino Unido para desarrollar una herramienta que permitiría a las agencias de aplicación de la ley buscar en imágenes de CCTV silenciosas e identificar cuándo las personas dicen ciertas palabras clave.

Comentarios

Popular

Herramientas de Evaluación de Sistemas Algorítmicos

Sistemas multiagentes: Desafíos técnicos y éticos del funcionamiento en un grupo mixto

Controversias éticas en torno a la privacidad, la confidencialidad y el anonimato en investigación social