Blog de Juan José Ortega

Blog acerca de nuestro acontecer diario

Enseñan a las máquinas a entender lo que ven

Los investigadores Ikerbasque Fadi Dornaika e Ignacio Arganda del Departamento de Ciencias de la Computación e Inteligencia Artificial de la UPV/EHU (España) proponen avances en la visión por ordenador y el aprendizaje automático. Concretamente, han obtenido muy buenos resultados utilizando técnicas semisupervisadas en el campo de predicción de la belleza facial, y, por otra parte, han estudiado qué funciones de error ayudan a entrenar mejor a las redes para mejorar la estimación de la edad facial.

 

La investigación en inteligencia artificial abarca muchísimos campos con el objetivo de conseguir la que podría ser la máquina inteligente ideal que percibe su entorno y lleva a cabo acciones que maximicen sus posibilidades de éxito en algún objetivo o tarea. El grupo Computer Vision and Pattern Discovery de la UPV/EHU se dedica a la visión por ordenador y al aprendizaje automático. “Básicamente, utilizamos técnicas modernas de inteligencia artificial para resolver problemas de imagen muy diversos, en imágenes de todo tipo: 2D, 3D, vídeos, etc.”, explica Ignacio Arganda, investigador Ikerbasque del Departamento de Ciencias de la Computación e Inteligencia Artificial de la UPV/EHU.

 

De hecho, el grupo de investigación está especializado en temas tan diversos como imágenes biomédicas (detección de células, tejidos, tumores…), imágenes faciales (percepción de la belleza, estimación de la edad) o imágenes de la calle (localización de vehículos, peatones…), que abordan en colaboración con investigadores de otras entidades y centros de investigación. “En general, son técnicas de aprendizaje automático, porque normalmente partimos de un conjunto de datos, imágenes o vídeos etiquetados (en los que se conoce dónde están los objetos o qué tipo de categoría tienen), con los que enseñamos o entrenamos a nuestros modelos estadísticos o de inteligencia artificial a asignar esas mismas etiquetas a ejemplos que no habían visto antes”, explica Arganda.

En sendas investigaciones relacionadas con las imágenes faciales, los investigadores han propuesto mejoras en relación con la predicción de la belleza y la estimación de la edad. “En la investigación de la predicción de la belleza, intentamos replicar las puntuaciones de belleza dadas en diferentes bases de datos, utilizando técnicas semisupervisadas (en las que no todas las imágenes están etiquetadas) —explica el doctor Arganda—. Para eso, utilizamos redes en las que se extraen diferentes características que se utilizan para entrenar a los modelos con los que predecir la belleza”. En esta línea, los miembros del equipo han demostrado que “el aprendizaje semisupervisado, nunca utilizado hasta ahora para este tipo de problema, da tan buenos resultados o incluso mejores que el supervisado (en el que todas las imágenes están etiquetadas)”, apunta.

 

“Para la estimación de la edad, se utilizan redes neuronales convolucionales (CNN): lo que se tiene es una imagen de entrada; una serie de filtros van extrayendo características que ayudan a tomar la decisión final, o sea un número, en este caso la edad”, añade. En esta línea, “hicimos un estudio empírico para ver qué funciones de error ayudan a entrenar mejor a las redes en este ámbito, porque el error en las estimaciones se puede minimizar de maneras diferentes”, explica el investigador. Los resultados experimentales obtenidos han demostrado la manera en la que se puede mejorar la estimación de la edad.

 

Para este tipo de predicciones y estimaciones se utilizan redes neuronales profundas: “Redes con muchísimas conexiones, muchísimos filtros, millones de datos… Pero es importante entender en qué se está fijando la red para predecir la edad de una persona, o hacer cualquier otro tipo de predicción. Actualmente, existe otro campo de investigación, en el que estamos sumergidos, llamado inteligencia artificial explicable o interpretable, que estudia técnicas con las que dilucidar en qué pone la red su atención”, explica Arganda.

 

Asimismo, el investigador alerta de que “las técnicas de aprendizaje automático nos afectan en la vida más de lo que pensamos. Se están generando muchísimos datos y se están tomando decisiones de alto nivel en función de estos sistemas. Es muy importante tener en cuenta el factor ético. De hecho, en el aprendizaje automático se utilizan bases de datos gigantescas con las que se entrenan los modelos, y todos los sesgos que contienen estos datos se replican en las predicciones y estimaciones que hacen los modelos, y puede ser realmente nocivo. En ese sentido, hay investigaciones abiertas en la que se estudia cómo quitar los diferentes sesgos de los datos”. En opinión de Arganda, “estamos en un momento apasionante en este campo”.

 

Fadi Dornaika, Ikerbasque research professor del Departamento de Ciencias de la Computación e Inteligencia Artificial de la UPV/EHU, es líder del grupo de investigación Computer Vision and Pattern Discovery y está especializado en visión por ordenador, procesamiento de imagen, reconocimiento de patrones y aprendizaje automático. En las investigaciones han participado, además de Dornaika y Arganda, los investigadores del grupo Anne Elorza y Abdelmalik Moujahid, así como el estudiante de doctorado en cotutela Kunwei Wang, y, por otra parte, S.E. Bekhouche de la Universidad de Oulu (Finlandia) y la Universidad de Djelfa (Argelia). (Fuente: UPV/EHU)

FUENTE: noticiasdelaciencia.com

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *