Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra

Identificación de las imágenes de fotos y de vídeos por ordenador

Investigadores de la Universidad de Granada desarrollan una técnica para detectar visualmente objetos y clasificarlos

Investigadores de la Universidad de Granada han desarrollado un sistema informático capaz de ordenar las imágenes (ya sean fotografías o vídeos) en los bancos de datos interpretando su contenido. La idea es superar las limitaciones de los archivos actuales, que responden a parámetros como la fecha de la imagen, el tamaño o las palabras que se le han asociado. El nuevo sistema, explican sus autores, permitiría clasificar de forma automática fotografías según aparezcan en ellas o no personas, o cualquier objeto concreto, e incluso diferenciar las escenas de los vídeos por la postura de los individuos filmados o sus acciones, como caminar, saltar o agacharse.

Se trata de una investigación de Manuel Marín Jiménez (actualmente en la Universidad de Córdoba), dirigida por Nicolás Pérez de la Blanca Capilla, del departamento de Ciencias de la Computación e Inteligencia Artificial de la Universidad de Granada.

Con la nueva tecnología, el ordenador aprende, por ejemplo en el caso de las personas, a identificar en la imagen la posición de la cabeza, el torso, los brazos y los antebrazos, con lo que propone una clasificación de las fotografías o vídeos.

Las grandes compañías mundiales de informática están muy interesadas en lograr que los ordenadores sean capaces de interpretar automáticamente el contenido visual de las imágenes, ya sean estáticas o de vídeo, explica Marín Jiménez en un comunicado de la Universidad de Granada. "Nuestro trabajo presenta pequeñas aportaciones para avanzar en este ambicioso problema", añade. El equipo español trabaja en esta investigación con expertos de la Universidad de Oxford (Reino Unido) y del Instituto de Tecnología de Zurich (Suiza).

La nueva técnica trata, por ejemplo, de identificar a las personas filmadas en un vídeo y los investigadores se han centrado en la parte superior del cuerpo, ya que en la mayoría de los programas de televisión se utilizan abundantes planos en los que se ve a la gente preferentemente de cintura para arriba. Las posibles configuraciones de la imagen del cuerpo son muchas, explican los expertos británicos, e intervienen abundantes factores variables, aún partiendo de la presunción de que la persona está erguida y no boca abajo. Puede haber alguien en cualquier zona del fotograma, visible a cualquier escala, vistiendo cualquier tipo de ropa de cualquier color, etcétera. Además, la o las personas pueden estar en movimiento, pero también puede moverse la cámara o el fondo.

En estas condiciones, la sola determinación de la apariencia, la postura, la localización, la escala y los movimientos es una tarea difícil para un ordenador. Lo que estos científicos hacen con su técnica es introducir una fase inicial genérica de detección de personas atendiendo a la postura y la apariencia, lo que proporciona una localización del sujeto o los sujetos, así como la escala, indicando dónde debe estar el torso y la cabeza. A continuación se aplican modelos de color para mejorar la identificación de las personas automáticamente. Así se va acotando los parámetros de búsqueda y detección de las partes del cuerpo para definir su acción. El sistema también tiene en cuenta cómo está orientada la persona en la imagen.

Más información

  • Investigadores de la Universidad de Granada desarrollan una técnica para detectar visualmente objetos y clasificarlos