_
_
_
_
_

El reconocimiento de voz para dialogar con máquinas avanza en la industria y los móviles

¿Necesita que le devuelvan el IVA pero no se atreve a insistir para no parecer descortés? No hay problema: llame al 901 12 12 24 y compruebe que, tras pedirle el DNI y la cantidad de euros a devolver, le dan una respuesta efectiva. En realidad, el funcionario que le contesta es un robot. Un servidor de voz que de enero a junio ha atendido 2,3 millones de llamadas, la mayoría sobre la devolución del IVA. Su implantación en la Agencia Tributaria representa otro avance de la tecnología de reconocimiento de voz (RV) en su viaje de los dominios de la ciencia-ficción a la vida cotidiana.

Pensada para mejorar el diálogo entre humanos y máquinas, la RV se empezó a usar en ordenadores capaces de obedecer mandatos vocales y transcribir dictados. También ha hecho fortuna en los centros de atención al cliente, automatizando las gestiones telefónicas.

El impulso de VoiceXML

Una generación más sofisticada de RV se empieza a integrar en aplicaciones corporativas, aprovechando el impulso que el estándar VoiceXML da a la convergencia entre Internet y los servicios de respuesta vocal. O el de SALT, el estándar alternativo que impulsa Microsoft, entre otros, y pone el énfasis en la sincronización de los servicios de acceso que utilizan los clientes de una empresa.

Unisys, Oracle y Siebel ya incluyen aplicaciones de RV de terceros fabricantes en sus soluciones empresariales. IBM utiliza su motor, WebSphere Voice Server, disponible en castellano, para que la voz pueda interactuar con las aplicaciones web. 'Puede hacer lo mismo con las órdenes orales y la voz sintetizada que un sistema con teclado', dice Ángel Castillo, de IBM España.

Otro actor histórico en esta actividad es Philips. Tras varias décadas investigando en tecnología de voz, se está centrando ahora en soluciones sectoriales. Como Professional Speech Magic, destinado a entornos de radiología e integrado en entornos sanitarios de gestión de pacientes, cuya versión en castellano llegará en octubre.

Dos factores impulsan la confluencia entre el reconocimiento de voz y la empresa: el ahorro económico y la necesidad de automatizar las relaciones con el cliente. 'No podemos ni imaginar el coste que supone atender con personas las 720 líneas RDSI que cubre el robot', dice Santiago Segarra, jefe de Informática en la Agencia Tributaria.

Además, 'son más eficaces a la hora de interpretar datos en tiempo real, como los servicios de Bolsa', añade Luis Villarubia, responsable de tecnología del habla en Telefónica I+D.

¿Inconvenientes? 'Para dar un buen servicio hay que diseñar bien la ergonomía del sistema y prever cuál puede ser su reacción en cada fase', admite Villarrubia.

Complejidad y costes crecen cuando el sistema necesita entender diferentes lenguajes: la satisfacción de los clientes aumenta si se les atiende en su idioma. 'Nuestros productos entienden castellano, catalán, vasco y gallego, además del español peruano y argentino y el portugués brasileño', dice Villarrubia.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_