Un salto visionario: mejora de la visión artificial para vehículos autónomos y cyborgs

vision-artificial-vehiculos-francisco-perez-yoma


Los automóviles autónomos podrían beneficiarse de una detección mejorada de objetos mediante el uso del aprendizaje autosupervisado.

El desarrollo de avatares robóticos podría beneficiarse de una mejora en la forma en que las computadoras detectan objetos en imágenes de baja resolución.

Un equipo de RIKEN en Japón ha mejorado las capacidades de reconocimiento de visión por computadora al entrenar algoritmos para identificar mejor los objetos en imágenes de baja resolución. 

Inspirado en las técnicas de formación de la memoria del cerebro humano, el modelo degrada la calidad de las imágenes de alta resolución para entrenar el algoritmo en el aprendizaje autosupervisado, mejorando el reconocimiento de objetos en imágenes de baja calidad. 

Se espera que el desarrollo beneficie no solo a las aplicaciones tradicionales de visión artificial, sino también a la creación de avatares cibernéticos y tecnología de imágenes de terahercios.

Mejora de la visión del avatar robótico inspirada en la percepción humana

Con solo hacer un pequeño ajuste a los algoritmos que normalmente se usan para mejorar las imágenes, se podrían aumentar drásticamente las capacidades de reconocimiento de visión por computadora en aplicaciones que van desde automóviles que se conducen solos hasta avatares cibernéticos. Esto lo demuestra una nueva investigación de científicos de RIKEN en Japón.

Enfoque no convencional de la visión artificial

Claramente diferente de la mayoría de los expertos en inteligencia artificial (IA), Lin Gu del Centro RIKEN para el Proyecto de Inteligencia Avanzada comenzó su carrera como terapeuta. 

Esta experiencia le dio una visión única de la variación de escala, un problema crítico que enfrenta la visión por computadora que se refiere a la dificultad de detectar con precisión objetos en diferentes escalas en una imagen. 

Debido a que la mayoría de los sistemas de IA están entrenados en imágenes de alta resolución, las imágenes realistas de baja calidad con características borrosas o distorsionadas representan un desafío para los algoritmos de reconocimiento.

La situación le recordó a Gu el síndrome de Alicia en el País de las Maravillas, una condición de visión distorsionada que hace que los objetos parezcan más pequeños o más grandes de lo que realmente son. 

"La visión humana tiene una constancia de tamaño, lo que significa que percibimos los objetos del mismo tamaño a pesar de cómo cambia la imagen de la retina", dice Gu. “Por el contrario, los algoritmos de visión por computadora existentes carecen de esa constancia, como Alice”.

Un enfoque novedoso para el reconocimiento de imágenes

Lin Gu y Tatsuya Harada lideraron un equipo que ha desarrollado un algoritmo de inteligencia artificial capaz de mejorar la detección de objetos asistida por computadora en automóviles autónomos y avatares cibernéticos.

Ahora, inspirados en las técnicas de reproducción del hipocampo utilizadas por el cerebro para formar recuerdos, Gu y sus colegas han desarrollado un modelo que degrada aleatoriamente la resolución, la borrosidad y el ruido de una imagen de alta resolución, en busca de características que permanecen iguales después de cambios repetidos. .

Al entrenarse con los datos generados, el algoritmo puede realizar un aprendizaje autosupervisado: ayudar a otros algoritmos de procesamiento de imágenes a descubrir qué objetos hay en la imagen y dónde están ubicados sin intervención humana. El resultado: un método computacionalmente más eficiente para codificar y restaurar los detalles críticos en una imagen.

“En los métodos típicos de aprendizaje autosupervisado, los datos de entrenamiento se modifican enmascarando parte de la imagen o cambiando el contraste antes de aprender la señal de supervisión”, explica Gu. "Proponemos usar la resolución como una pista de autosupervisión por primera vez".

Futuras implicaciones y colaboraciones

Además de los usos típicos de la visión por computadora, Gu señala que la representación perceptual constante será una parte fundamental de las tecnologías relacionadas con los cyborgs y los avatares. 

Como ejemplo, cita su participación en un proyecto futurista de agencias científicas japonesas para crear una versión digital realista de un ministro del gobierno que pueda interactuar con los ciudadanos.

"Para el mecanismo de la memoria artificial, las representaciones que son invariantes a los cambios de resolución pueden actuar como una piedra angular", dice Gu. “Estoy trabajando con neurocientíficos en RIKEN para explorar la relación entre la representación constante perpetua artificial y la real en el cerebro”.

Este método también se está aplicando a la generación de imágenes de terahercios, una técnica de generación de imágenes no destructivas emergente con mucho potencial en biomedicina, seguridad y caracterización de materiales. 

“Como parte de una colaboración continua con el equipo de Michael Johnston en la Universidad de Oxford, estamos desarrollando una nueva generación de dispositivos de imágenes de terahercios mediante el uso de IA para mejorar su calidad y resolución”, dice Gu.

Además se resalta un salto revolucionario en el ámbito de la visión artificial, atendiendo a las necesidades en constante evolución de los vehículos autónomos y la tecnología cíborg.


Los avances visionarios discutidos en el artículo subrayan el notable progreso que se ha logrado, allanando el camino hacia vehículos autónomos más seguros, eficientes y adaptables. 


La integración de técnicas de visión por computadora de vanguardia con algoritmos de aprendizaje automático demuestra el potencial de redefinir el transporte, haciéndolo más inteligente y confiable

Traducido y adaptado de SciTechDaily