Reportaje:COMPUTACIÓN | Análisis de imagen

El ordenador que descifra partituras

C uando Beethoven escribía sus partituras, las llenaba de tachones e incluso se han conservado algunas anotadas con tanta furia que la punta de su pluma agujereó el papel. Ni a Beethoven, ni a los compositores de su época se les ocurrió que un día sus composiciones pudieran ser leídas por algo distinto del ojo humano. Pero, ¿qué ocurre si quien ha de descifrarlas es un ojo informático?

"Donde para nosotros hay una clave de sol, el ordenador sólo ve series de píxeles, unos blancos y otros negros" observa Gemma Sánchez, investigadora del Grupo de Análisis de Documentos del Centro de Visión por Computador (CVC) de la Universidad Autónoma de Barcelona. Si a este obstáculo inherente a la propia naturaleza del sistema informático se le añaden otros, como la diversidad en la escritura a mano (incluso cuando es obra de una misma persona), los borrones o un papel amarilleado por el tiempo, la tarea puede complicarse ad infinitum.

Un nuevo proyecto se ocupa de expedientes de frontera del Archivo Histórico de Girona
El sistema ahorra tiempo a los musicólogos al copiar manuscritos antiguos

Más información

"El texto manuscrito conlleva siempre distorsiones de las formas", remacha Josep Lladós, subdirector del CVC y responsable de su Grupo de Análisis de Documentos. Tanto Sánchez como Lladós han participado en el desarrollo de un novedoso sistema de reconocimiento de antiguas partituras manuscritas. El trabajo surgió como proyecto de tesis doctoral Alicia Fornés, y acaba de obtener el primer premio en el congreso ibérico de especialistas en análisis de imagen celebrado en Girona.

Conseguir que el ordenador reconozca automáticamente una clave de sol, por ejemplo, y la distinga de una corchea es de gran utilidad para los especialistas. Significa ir un paso más allá del simple escaneo de las partituras. Ahorra tiempo a los musicólogos, que querrían rehuir el pesado trabajo de copiar manuscritos antiguos, y facilita la transición hacia el tratamiento digital de la información musical, acelerando la obtención de archivos MIDI (un formato estándar que permite que el ordenador toque directamente la partitura).

En la distinción de formas mediante mecanismos informáticos se trabaja con descriptores, sistemas capaces de discriminar con mucha sutileza entre caracteres o símbolos, para reconocerlos con un alto porcentaje de fiabilidad, pero sin que este buen tino requiera de un cálculo exhaustivo y en consecuencia lento, que complicaría el proceso de reconocimiento. El trabajo del equipo del CVC supone un avance en el desarrollo de estos descriptores.

"Nos encontramos con el problema de que los compositores escribían los símbolos musicales de forma muy diferente", explica Fornés, quien además de informática es música (estudió piano en el Conservatorio). "La variación debida al estilo de escritura se acentuaba aún más al tratar con partituras de diferentes siglos". En las pruebas previas con descriptores comunes los resultados eran decepcionantes: "La variación era demasiado importante como para que las diversas clases de símbolos fueran separables, así que se confundían fácilmente", recuerda.

Enfrentados ante ese laberinto de grafías, uno de los miembros del equipo, Sergio Escalera, tuvo una idea decisiva: "Se le ocurrió crear un método que difuminara la forma del símbolo", recuerda Fornés. "Es como si provocáramos la miopía del sistema". Así surgió un descriptor que no tiene en cuenta las variaciones de cada individuo en su forma de escribir los símbolos, y que se centra en encontrar las partes del símbolo más comunes, es decir, los trazos compartidos entre todos los autores. Lo bautizaron con el nombre de Modelo de Forma Difusa.

Hubo también otras dificultades. Lladós destaca que "uno de los obstáculos que hay que sortear son las propias cinco líneas horizontales del pentagrama, que le perturban en el reconocimiento exacto de las formas". Para deshacerse de estas señales no deseadas, "el descriptor ha de reconocer las líneas y extraerlas, pero teniendo en cuenta que hay píxeles en los que se da una intersección entre la línea del pentagrama y una nota musical; mediante un proceso previo, el programa reconstruye aquellos puntos donde se produce un cruc", comenta Lladós.

Para probar su eficacia se procedió a una comparativa con otros tres descriptores. A todos se les puso a examinar una colección de partituras del siglo XVIII y XIX procedentes del Archivo del Seminario de Barcelona, con un total de 2.128 ejemplos de tres tipos de claves, realizadas por 24 autores diferentes. El nuevo modelo alcanzó una eficacia del 98%, mientras que los otros se quedaron respectivamente en el 92%, el 81% y el 64%.

Este nuevo sistema va a tener usos más allá de las partituras, al estar concebido también para otros alfabetos gráficos, como los signos habituales en los planos arquitectónicos manuscritos. Ahí surge un nuevo problema: "En los planos aparecen símbolos en cualquier posición y rotados de múltiples maneras. En estos casos, nuestro descriptor fallaría, ya que no es lo mismo intentar reconocer un símbolo sin rotación u otro rotado 180 grados", puntualiza Fornés. Por ello, uno de los objetivos actuales de los investigadores del CVC es conseguir la invariabilidad del descriptor ante cualquier ubicación de los elementos analizados.

La transposición informática de documentos antiguos es un proceso en auge, pero se ha avanzado mucho menos en el paso siguiente: el reconocimiento automático de caracteres en estos legajos. El grupo del CVC utilizará el nuevo descriptor para avanzar. Un proyecto en marcha trata los textos que aparecen en los llamados expedientes de frontera, del Archivo Histórico de Girona. Son informes con los datos de las personas que cruzaron la aduana hispano-francesa de La Jonquera entre 1940 y 1976, emitidos por el Gobierno Civil, y resultan de gran importancia para el estudio de los movimientos de migración al final de la Guerra Civil y durante la Segunda Guerra Mundial.

En un pentagrama manuscrito, el sistema informático debe detectar y segmentar las claves (recuadradas) para su posterior clasificación.
En un pentagrama manuscrito, el sistema informático debe detectar y segmentar las claves (recuadradas) para su posterior clasificación.CVC
Las claves sol, do y fa de partituras manuscritas, y su clasificación por el ordenador en la columna de la izquierda.
Las claves sol, do y fa de partituras manuscritas, y su clasificación por el ordenador en la columna de la izquierda.CVC

* Este artículo apareció en la edición impresa del martes, 17 de julio de 2007.

Archivado En:

Te puede interesar

Lo más visto en...

Top 50