Éxito del empleo de la inteligencia artificial para luchar contra la invasión del correo basura
'Es posible parar el spam, y los filtros basados en el contenido son la mejor forma. El talón de Aquiles de los spammers es su mensaje. Pueden saltarse todas las barreras que les pongamos, menos ésa'. Así presenta el informático Paul Graham su idea para luchar contra el correo basura, que ha hecho correr ríos de bits en la red. Con una técnica de inteligencia artificial llamada Lógica Bayesiana, afirma conseguir casi un 100% de efectividad.
La Lógica Bayesiana, creada por el matemático inglés Thomas Bayes en 1763, se basa en las estadísticas y las probabilidades para predecir el futuro. Por ejemplo, la palabra sexy es muy probable que aparezca en un correo basura. A partir de aquí, es fácil escribir un algoritmo que filtre los mensajes que contengan palabras peligrosas. 'Filtrando por la palabra clic acabaría con el 79,7% del spam que recibo, con sólo un 1,2% de errores', dice Graham.
Cuando llega un nuevo mensaje, el programa compara su contenido con la lista de palabras prohibidas, analiza el contexto y calcula las probabilidades de que sea una carta basura: 'Se tiene en consideración tanto lo bueno como lo malo: palabras que no suelen aparecer en los spams, como aparentemente, reducen mucho la probabilidad, mientras otras como unsubscribe o Viagra la incrementan. Por tanto, una inocente carta que contenga la palabra sexo no tiene por qué ser tratada como spam', explica.
La ventaja ante la mayoría de filtros que sólo tienen en consideración las listas negras, o los más nuevos, que se fijan también en el contenido, es que 'los filtros bayesianos evolucionan con el spam. Si cambian las palabras, los filtros se dan cuenta automáticamente.Para vencerlos, los autores del correo basura deberían hacer sus mensajes indistinguibles del resto, lo que les constreñiría mucho, ya que la mayoría tienen intenciones comerciales y usan una jerga determinada para sus fines', explica.
Según Graham, los filtros bayesianos reconocen el 99,5% de correo basura y son adaptables a cada caso. Existen ya dos programas basados en la idea, Bogofilter y Bayespam, para GNU/Linux, en versiones beta. Graham trabaja en Arc, un lenguaje de programación con el que piensa crear un filtro para el correo electrónico.
Según recientes estudios, el correo basura representa el 36% de los mensajes que reciben los internautas.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.