El proyecto “Harnessing Vision Science to Overcome the Critical Limitations of Artificial Neural Networks” ha sido uno de los 5 proyectos seleccionados en el Programa Fundamentos de la Fundación BBVA

Ciencias de la imagen y la visión (IVIS)

Madrid / 19 de febrero de 2024

La convocatoria del Programa Fundamentos de la Fundación BBVA ha sido resuelta con la concesión de ayudas de 600.000 euros por proyecto para el desarrollo de 5 investigaciones de carácter fundamental e interdisciplinar en diferentes áreas de la ciencia.

De entre ellas, el proyecto ganador en la categoría “Matemáticas, Estadística, Ciencias de la Computación, Inteligencia Artificial” ha sido el proyecto que lidera Marcelo Bertalmío, del Instituto de Óptica del CSIC; y en el que también participa Javier Portilla, también miembro del grupo de Ciencias de la Imagen y la Visión.

El objetivo de este Programa Fundamentos es apoyar la investigación exploratoria de cuestiones centrales o fundacionales de un campo científico o de la intersección de varias disciplinas.

En esta convocatoria del 2022 se han valorado total de 305 solicitudes y los proyectos ganadores tendrán un plazo de ejecución de 3 años.

El proyecto “Harnessing Vision Science to Overcome the Critical Limitations of Artificial Neural Networks (VIS4NN)”, tiene como objetivo principal el desarrollar un nuevo tipo de redes neuronales artificiales cuyo comportamiento sea más similar al de un observador humano y que no tengan las limitaciones de las inteligencias artificiales actuales que las incapacitan para realizar por sí solas algunas tareas que son triviales para humanos.

Las redes neuronales actuales se basan en los primeros modelos de funcionamiento de las neuronas de la vista que, aunque ya están superados por otros mejores, han permitido que las redes neuronales artificiales hayan conseguido unos resultados asombrosos en los últimos años teniendo múltiples aplicaciones en la ciencia, la industria y la sociedad en general.

Sin embargo, las expectativas de las capacidades de estas redes neuronales artificiales están chocando con unas limitaciones insalvables que les excluyen de poder realizar algunas tareas como por ejemplo el poder conducir un coche de forma completamente autónoma.

De los límites actuales de las redes neuronales artificiales, se considera que los más críticos son tres:

  1. Problemas de generalización. Las redes neuronales para realizar bien su tarea necesitan entrenarse con un conjunto de datos enorme, que cubra todas las posibilidades del mundo real porque si se encuentran algo no previsto en su conjunto de datos de entrenamiento sus posibilidades de acertar empeoran mucho.

 

En la columna de ImageNet, fotos de sillas de distintos tipos, en las columnas de ObjectNet fotos de sillas en posiciones absurdas
Columna izquierda: ejemplos de ImageNet. Columnas restantes: ejemplos de ObjectNet. Las redes neuronales entrenadas en ImageNet sufren una caída de rendimiento del 40 al 45 % cuando se prueban en ObjectNet, lo que muestra los problemas de generalización de las redes neuronales artificiales. / Instituto de Óptica
  1. Susceptibilidad a ataques de adversarios. Es sencillo hacer que falle la red neuronal si sabes cómo funciona.
4 fotos aparentemente iguales que son catalogadas como otros objetos, por ejemplo como un cocodrilo africano
La imagen original del plátano (arriba a la izquierda) está alterada por pequeñas perturbaciones intencionadas, de modo que una red neuronal artificial la clasifica erróneamente como una pelota de béisbol, un taladro eléctrico o un cocodrilo africano, dependiendo de la perturbación. / Instituto de Óptica
  1. Cantidad de datos de formación y costes energéticos asociados. La cantidad de energía que hay que consumir en entrenar a las cada vez mejores redes neuronales aumenta exponencialmente y se está convirtiendo en un problema más a añadir al calentamiento global.
Gráfica con una línea descendente que indica el error de las IAs y con datos de la contaminación que es necesaria para alcanzarlo
La extrapolación de la tendencia actual sugiere que la cantidad de datos, y los recursos computacionales asociados, necesarios para entrenar una ANN para que tuviera menos del 5% de error en el reconocimiento de objetos en la base de datos ImageNet sería tan grande que llevaría a la misma emisión de CO2 que la que genera la ciudad de Nueva York en un mes. / Instituto de Óptica
Por todo ello, la financiación de este importante Programa Fundamentos irá destinada a diseñar nuevos componentes que sirvan para una nueva generación de redes neuronales que utilicen resultados y técnicas muy recientes de ciencia de la visión que va más allá del modelo estándar.
Estas nuevas redes neuronales necesitarán muchos menos datos para ser entrenadas y serán más simples, reduciendo las emisiones de CO2 a la vez que se eliminan las limitaciones del anterior modelo.

Comunicación IO-CSIC
cultura.io@io.cfmac.csic.es

Noticias relacionadas

Suscripción