Selecciona Edición
Conéctate
Selecciona Edición
Tamaño letra

Las máquinas ya pueden sortear los CAPTCHA identificando las letras

La revista 'Science' publica un experimento que prueba un original enfoque de inteligencia artificial

Los CAPTCHA se diseñaron para diferenciar personas y máquinas.
Los CAPTCHA se diseñaron para diferenciar personas y máquinas.

El pionero de la inteligencia artificial Douglas Hofstadter aseguró: "Para que un programa se maneje con las formas de letras con la flexibilidad que tienen los seres humanos, debería poseer una inteligencia artificial a gran escala". Ahora, la revista Science nos pone al corriente de un notable paso en esa dirección. Allí, los científicos de la empresa Vicarious, especializada en inteligencia artificial, publican su logro: doblegar con una máquina los CAPTCHA, ese examen digital pensado precisamente para diferenciar humanos y máquinas.

"Hemos preparado a la máquina para que pueda hacer asunciones sobre cosas que nunca ha visto y responder a preguntas para las que no ha sido entrenado", afirma el investigador

En el estudio se detallan los resultados de una serie de experimentos realizados con el objetivo de probar su capacidad para resolver ese acertijo formado por palabras con letras deformes y borrosas, que cuestan resolver hasta a los humanos (que tienen un 87% de tasa de éxito). El programa desarrollado por Vicarious logra resolver más del 90% de las letras, dependiendo del sistema de CAPTCHA, y entre el 57% y el 67% de las palabras completas proporcionadas por plataformas como Yahoo! o PayPal. Estos sistemas CAPTCHA, que son las siglas en inglés de "test de Turing completamente automático y público para diferenciar ordenadores de humanos", se encuentran en numerosos programas y páginas web para identificar usuarios humanos e impedir que se infiltren de forma fraudulenta usuarios falsos generados por ordenador.

Más allá de porcentajes, los autores han logrado demostrar que su modelo probabilístico funciona para conseguir que la máquina sea capaz de inferir formas partiendo de un enfoque basado en la neurociencia de los humanos. "Hemos intentado hacer que la máquina resuelva el reto como lo resolvería un humano", explica el investigador Miguel Lázaro, uno de los firmantes del artículo de Science. En lugar de alimentar al programa con millones de imágenes, que es el enfoque de fuera bruta que generalmente se emplea en inteligencia artificial, los investigadores han proporcionado pocos ejemplos al ordenador, que sin embargo es capaz de aprender cómo es la letra y generalizar de una forma más intuitiva.

Del mismo modo que los humanos podemos identificar las letras a pesar del caos visual en el que lo representan, Lázaro y sus compañeros han conseguido que su programa (RCN) sea capaz de adivinar patrones a pesar de que cambien las proporciones, la apariencia o el contexto en el que se muestran estos caracteres. "Hemos preparado a la máquina para que pueda hacer asunciones sobre cosas que nunca ha visto y responder a preguntas para las que no ha sido entrenado", afirma el investigador español de Vicarious, una empresa que trata de desarrollar la inteligencia artificial a partir de modelos de neurociencia. Y añade Lázaro: "Hemos plasmado lo que sabemos de la inteligencia humana en un modelo probabilístico".

Una inteligencia que lo responda todo

Servirá para el desarrollo de robots que lean mejor lo que ven en su entorno, al identificar objetos en contextos confusos para las máquinas

Este es el motivo que hace más interesante el hallazgo que publica Science. Buena parte de los enfoques de inteligencia artificial se basan actualmente en el deep learning, que ha logrado grandes éxitos. Pero ese enfoque tiene unas características muy limitadas a la función para la que hayas entrenado a la máquina: puede ser campeón sobrehumano a un juego de mesa, pero se bloquearía si de pronto cambian las dimensiones del tablero. En cambio, el modelo gráfico probabilístico que han probado ahora ayuda a la máquina a ser más adaptativa en su lectura de lo que ve. Así, este mismo modelo visual se usa para letras, objetos, escenas, etc. "Queremos tener un sistema único que responda todas las preguntas, no un sistema para cada cosa", resume el investigador.

Lázaro, que antes de incorporarse a esta empresa de San Francisco investigaba en la Universidad Carlos III, explica que este logro permitirá avanzar en dos sentidos. "Por un lado, el científico, hacia una inteligencia artificial general, porque el sistema visual también sirve para pensar", asegura. Y por otro lado, más tangible, en el desarrollo de robots que puedan leer mejor lo que ven en su entorno, al identificar objetos individuales en contextos que hasta ahora son confusos para las máquinas.

Volviendo a la cita inicial Hofstadter, Lázaro cree que las máquinas están todavía lejos de comprender las formas de las letras con la misma eficiencia y flexibilidad que los humanos: "Somos capaces de romper los CAPTCHA, pero no por ello la máquina es capaz de reconocer la letra A. Un humano tiene la genialidad de ver la A en muchos contextos y todavía no estamos ahí", reconoce.

Vicarious anunció en 2013 que era capaz de quebrar el 90% de los CAPTCHA de la época, pero por aquel entonces esta empresa no quiso publicar sus resultados, que es la forma en la que los científicos ponen a prueba sus logros frente a sus colegas, por lo que recibió algunas críticas. Ahora que no corren riesgo de "perder ventaja frente a los competidores", en palabras de Lázaro, publican sus métodos en detalle en la revista Science. Hace tres meses, esta empresa logró recaudar 50 millones de dólares para ampliar sus investigaciones, atrayendo el dinero de personajes tan influyentes en Silicon Valley como Mark Zuckerberg y Elon Musk.

Más información