ArchivoEdición impresa

Acceso a suscriptores »

Accede a EL PAÍS y todos sus suplementos en formato PDF enriquecido

martes, 9 de agosto de 2011
Reportaje:Servicios

Un español enseña idiomas a Google

El ingeniero Pedro Moreno se ha especializado en tecnologías del habla - Los países árabes centran el interés de la empresa del buscador

Archivado en:

¿Cómo hace Google para entender lo que decimos? ¿Por qué el vietnamita resulta muy complicado y el zulú lo reconoce con gran facilidad? Pedro Moreno (Elche, 1964), ingeniero español, tiene la solución a estas cuestiones. Su día a día es el reconocimiento de voz en el buscador. Cuando obtuvo una beca Fullbright en 1989 pensaba en volver a España. Sus primeros pasos en Estados Unidos fueron en AT&T. Después terminó en Google. Ahora, desde las oficinas de Nueva York, forma parte de un grupo de 40 personas dedicadas a hacer que Google, el buscador, entienda cualquier idioma. No solo para la versión de escritorio, sino también, y sobre todo, para evitar teclear desde el móvil.

En los últimos tiempos, los avances de estos laboratorios se están usando en YouTube para transcribir el diálogo de cualquier vídeo a texto. Hace seis años comenzaron el reto. Lo lógico era empezar por el inglés y así lo hicieron. Moreno admite: "Todavía tenemos errores y seguirán existiendo mientras trabajemos con algo que es modulable, como los idiomas". La labor de los usuarios es clave para la evolución del servicio. "Por mucho que contratemos a locutores, es la voz de la calle la que nos vale. Por eso pedimos que los internautas envíen opiniones", dice Moreno. Vaticina que en un futuro próximo su buscador "se adaptará al acento de cada uno, irá aprendiendo sobre la marcha".

Los avances se están usando para convertir la voz de un vídeo en texto

El método usado para reconocer el habla en inglés y buscar tuvo que ser modificado para el segundo lenguaje, el chino mandarín. "Demográficamente era lo lógico", justifica Moreno, "y en aquel momento Google tenía gran interés por establecerse allí. Luego todos sabemos cómo terminó la historia". Hasta que no se pusieron a trabajar no se dieron cuenta del reto que afrontaban. Hasta entonces usaban dos formas de reconocer combinadas: por léxico y por la gramática del lenguaje. Así, los sonidos iban cobrando significado. Pero, en el caso del chino, el tono era una nueva variante a tener en cuenta. Descubrieron que la entonación decía más que la propia sucesión de sonidos. Gracias a esta dificultad nació el método que ha servido para reconocer más de 30 idiomas. Google tiene un programa de registro que instalan en teléfonos Android para recabar los datos sobre el terreno.

Al comienzo tardaron meses, ahora, con dos semanas de datos tienen material para ponerse a trabajar. A pesar de las ideas preconcebidas, Moreno cree que el reconocimiento del euskera, al menos para Google, sería de los que con dos semanas basta. Sencillo, pero no para los humanos...

¿Dónde están ahora esas máquinas de trabajo de campo? En países árabes. Moreno considera que es lógico el interés por esta zona: "Tras las revueltas creemos que es de sentido común dotarles de mejores herramientas. Las primeras pruebas resultan".

El objetivo de Google Voice es llegar a 300 idiomas. "Que son los que hablan más de un millón de personas", aclara Moreno, "pero nos gustaría seguir con más. Queremos que la gente pueda hablar al móvil y buscar en Google, sin más complicaciones". Como un guiño decidieron dar de alta una lengua muerta, teóricamente, pero llena de valor cultural: el latín. Más allá del agradecimiento por parte de la comunidad eclesiástica, les sirvió para manejar mejor los idiomas que se declinan. "Así, el reconocimiento de ruso, alemán y los idiomas de los países nórdicos fue mucho más sencillo", se felicita el ingeniero.

El último gran descubrimiento lo hicieron al traducir las lenguas africanas. El estreno fue con el zulú. Hubo una nueva dificultad: los chasquidos. "Es un tipo de sonido que se hace con la lengua, son como clics que, con nuestro oído occidental, resulta difícil de detectar", explica el experto, "pero nos sirvió para mejorar las técnicas de modelado acústico y usarlo en el afrikaans, por ejemplo".

El más difícil todavía para Google ha sido comprender el habla de Hong Kong, donde el 20% de las palabras son en inglés y el resto una mezcla de chino e influencias cercanas. Superada esta prueba, Pedro Moreno no se amilana ante ninguna otra.

Pedro Moreno trabaja en el reconocimiento de voz.

Atención al cliente

Teléfono: 902 20 21 41

Nuestro horario de atención al cliente es de 9 a 14 los días laborables

Formulario de contacto »

Lo más visto en...

» Top 50

Webs de PRISA

cerrar ventana