Evaluación de calidad de imagen y vídeo de última generación con una métrica basada en un modelo de suma neuronal intrínsecamente no lineal

Ciencias de la imagen y la visión (IVIS)

  • Investigadores españoles desarrollan nueva métrica que mejora la evaluación automatizada de la calidad de imagen y vídeo.

Madrid / 30 de agosto de 2023

Un equipo de científicos del Instituto de Óptica, del Consejo Superior de Investigaciones Científicas (CSIC) en Madrid, y del Departamento de Tecnologías de la Información y las Comunicaciones de la Universitat Pompeu Fabra en Barcelona, ha desarrollado una métrica innovadora para evaluar la calidad de imágenes y videos. Esta métrica, basada en un modelo de suma neuronal intrínsecamente no lineal, podría revolucionar la forma en que se mide la calidad visual de imágenes y vídeos en la industria de los medios y en la investigación de la visión por computadora.

En nuestro cerebro, la suma neuronal es el proceso mediante el cual se agregan múltiples señales excitadoras o inhibidoras para generar un efecto acumulativo en la sinapsis de salida de la neurona.
La evaluación automática de la calidad de la imagen y el vídeo es hoy en día un desafío en las ciencias de la visión. Aunque los métodos de evaluación han avanzado significativamente en las últimas dos décadas, todavía existen deficiencias notables. En particular, estos métodos a menudo sufren de un rendimiento deficiente cuando se prueban en bases de datos diferentes a las que se utilizaron para su entrenamiento y tienen dificultades para predecir la calidad percibida de los observadores humanos en vídeos con alta velocidad de fotogramas.
Dos imágenes de una mujer, una más pixelada que la otra, encima de ellas se puede leer: "Full Reference, How different do you see these images?"
Los métodos de calidad de imagen emulan la respuesta de un observador humano cuando se le presentan 2 versiones de una imagen y se le pregunta cuan parecidas son
El equipo de investigación, compuesto por Raúl Luna, Itziar Zabaleta y Marcelo Bertalmío, ha propuesto en este trabajo un nuevo enfoque para superar estas limitaciones. Han desarrollado una métrica de la calidad de imagen basada en el campo receptivo intrínsecamente no lineal (INRF), un modelo de suma neuronal que ha demostrado ser mejor para predecir la actividad neuronal y los fenómenos de percepción visual humanos.
Los investigadores optimizaron esta métrica en una base de datos clásica de calidad de imagen y luego la probaron en otras tres bases de datos. Los resultados demostraron que su rendimiento iguala o supera a los métodos actuales de última generación. Además, ampliaron esta métrica de calidad de imagen al dominio temporal para la evaluación de la calidad del vídeo y obtuvieron resultados igualmente competitivos.
En particular, la métrica mostró un rendimiento excepcional en el desafiante conjunto de datos de calidad de video LIVE-YT-HFR, superando a todos los modelos de última generación. Por lo tanto, esta nueva métrica podría ser particularmente útil para evaluar la calidad de los vídeos de alta velocidad de fotogramas.
Esta investigación podría allanar el camino para la aplicación de modelos de neurociencia al diseño de algoritmos para evaluaciones de calidad de imagen y vídeo. Este enfoque innovador promete mejorar la precisión de estas evaluaciones y hacerlas más parecidas a la percepción humana.

Comunicación IO-CSIC
cultura.io@io.cfmac.csic.es

Noticias relacionadas

Suscripción