La voz, próxima arma en la batalla de los buscadores
El reciente anuncio de que Microsoft adquirirá Tellme Networks indica que algo se cuece en el mercado de la tecnología de reconocimiento de voz. El gigante del software podría pagar 800 millones de dólares, la cantidad más alta que Microsoft ha pagado por una adquisición desde el año 2000. Tellme cuenta con un amplio catálogo de soluciones de voz y se encarga de ofrecer el soporte telefónico de compañías norteamericanas como FedEx o Merrill Lynch utilizando robots que interactúan con los clientes para incrementar su satisfacción y rebajar los costes.
El mercado de las aplicaciones de reconocimiento de voz continúa creciendo en todo el mundo. La consultora Opus Research asegura que en 2006 las empresas dedicaron 1.120 millones de dólares a servicios, hardware y software de tecnología de voz, un 35 por ciento más que los 835 millones de dólares invertidos en 2005.
Entre las instituciones que han adoptado esta tecnología en España destaca la Agencia Tributaria. Su robot permite a los contribuyentes solicitar el borrador de la declaración de renta, pedir cita si desean corregirlo o consultar el estado de la devolución de su renta, todo ello vía telefónica y sin necesidad de que intervenga ningún agente humano.
Sin embargo, y a pesar de los importantes recursos dedicados a las iniciativas de I+D en este campo, el uso masivo del reconocimiento de tecnologías de voz sigue sin eclosionar. Hoy por hoy muchos clientes de centros de llamadas prefieren hablar con agentes humanos para evitarse los reiterados mensajes de "No le he entendido bien" y otras torpezas que cometen los robots menos sofisticados.
En los entornos de ordenadores de sobremesa y portátiles el índice de aciertos de los programas de reconocimiento de voz es muy alto una vez que se les ha "entrenado" en captar la voz del usuario. Estos programas para PC resultan especialmente útiles en entornos industriales donde los usuarios tienen que tener las manos ocupadas, donde se necesiten mecanografiar textos repetitivos, o para el uso de personas discapacitadas.
Sin embargo, lo cierto es que la gran mayoría de usuarios siguen prefiriendo el teclado como dispositivo de entrada del ordenador. El nuevo sistema operativo de Windows Vista, por ejemplo, incluye software avanzado de reconocimiento de voz pero dado que su uso es todavía minoritario Microsoft apenas hace énfasis en esa capacidad.
Otros usos de la tecnología de reconocimiento de voz están todavía en fase de exploración. En la reciente edición de la CES, la feria de electrónica de consumo que cada año se celebra en Las Vegas, Bill Gates y algunos ejecutivos de Ford explicaron este año que el software de sincronización Sync de Microsoft permitirá a los conductores poner en marcha sus reproductores de música con órdenes habladas. También en el campo de la logística se registran avances en este sentido y ya se comercializan sistemas que permiten gestionar la recogida de productos con órdenes dictadas.
Sin embargo, los movimientos más intensos de este mercado se producen en el área de entornos móviles. No sólo Microsoft ha movido ficha en este segmento. Yahoo! ha contratado recientemente a dos directivos de la citada Tellme Networks y a 13 ingenieros de Nuance. Esta última compañía, propietaria de aplicaciones para PC como el veterano Dragon Naturally Speaking, ha dotado a sus empleados de dispositivos móviles Blackberry con reconocimiento de voz. Utilizando la voz pueden gestionar los contactos, navegar por Internet y encontrar servicios e informaciones utilizando la voz. También pueden dictar la dirección del correo electrónico, el campo asunto y el texto, lo que resulta muy útil en unos dispositivos cuyos teclados son necesariamente pequeños y por tanto incómodos de utilizar.
Con todo, la aplicación de estas tecnologías en los dispositivos móviles todavía tiene mucho camino por delante. Una reciente reseña del Wall Street Journal sobre un teléfono móvil de Hewlett-Packard carga contra el uso poco inteligente que el dispositivo hacía del reconocimiento de voz. El teléfono no permite dictar SMS, afirma su autor, y los mensajes de correo electrónicos dictados sólo pueden enviarse como archivos de voz adjuntos, en lugar de transformarse en un texto capaz de ser modificado o impreso. Además, prosigue, sólo funciona con Microsoft Exchange, de modo que el usuario no puede utilizar mensajes con cuentas de correo tan extendidas como las de Yahoo! o Google, por ejemplo. El artículo también revela los inconvenientes de este tipo de sistemas: no pueden utilizarse en un lugar ruidoso, confunden los nombres difíciles de pronunciar y en muchas ocasiones se tarda más en dictar un mensaje que en escribirlo.
Si esto es así, ¿qué justifica las últimas inversiones de Yahoo! y Microsoft en esta tecnología? En realidad, lo que buscan ambas compañías ahora es posicionarse para participar en la próxima gran batalla de los buscadores de Internet: las búsquedas dictadas a través de móviles cuyas respuestas no se escuchan sino que se leen. La tecnología de reconocimiento de voz es todavía una apuesta de futuro, pero en el campo de las búsquedas por móvil este futuro parece estar más cerca.
Brian Subirana es miembro del e-business Center PwC&IESE y profesor del IESE
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.