SEGURIDAD

Éxito del empleo de la inteligencia artificial para luchar contra la invasión del correo basura

12 sept 2002 - 00:00CEST

'Es posible parar el spam, y los filtros basados en el contenido son la mejor forma. El talón de Aquiles de los spammers es su mensaje. Pueden saltarse todas las barreras que les pongamos, menos ésa'. Así presenta el informático Paul Graham su idea para luchar contra el correo basura, que ha hecho correr ríos de bits en la red. Con una técnica de inteligencia artificial llamada Lógica Bayesiana, afirma conseguir casi un 100% de efectividad.

La Lógica Bayesiana, creada por el matemático inglés Thomas Bayes en 1763, se basa en las estadísticas y las probabilidades para prede...

Suscríbete para seguir leyendo

Lee sin límites

Seguir leyendo Seguir leyendo

Ya soy suscriptor

La Lógica Bayesiana, creada por el matemático inglés Thomas Bayes en 1763, se basa en las estadísticas y las probabilidades para predecir el futuro. Por ejemplo, la palabra sexy es muy probable que aparezca en un correo basura. A partir de aquí, es fácil escribir un algoritmo que filtre los mensajes que contengan palabras peligrosas. 'Filtrando por la palabra clic acabaría con el 79,7% del spam que recibo, con sólo un 1,2% de errores', dice Graham.

Más información

A PLAN FOR SPAM::

BOGOFILTER::

BAYESPAM::

Cuando llega un nuevo mensaje, el programa compara su contenido con la lista de palabras prohibidas, analiza el contexto y calcula las probabilidades de que sea una carta basura: 'Se tiene en consideración tanto lo bueno como lo malo: palabras que no suelen aparecer en los spams, como aparentemente, reducen mucho la probabilidad, mientras otras como unsubscribe o Viagra la incrementan. Por tanto, una inocente carta que contenga la palabra sexo no tiene por qué ser tratada como spam', explica.

La ventaja ante la mayoría de filtros que sólo tienen en consideración las listas negras, o los más nuevos, que se fijan también en el contenido, es que 'los filtros bayesianos evolucionan con el spam. Si cambian las palabras, los filtros se dan cuenta automáticamente.Para vencerlos, los autores del correo basura deberían hacer sus mensajes indistinguibles del resto, lo que les constreñiría mucho, ya que la mayoría tienen intenciones comerciales y usan una jerga determinada para sus fines', explica.

Según Graham, los filtros bayesianos reconocen el 99,5% de correo basura y son adaptables a cada caso. Existen ya dos programas basados en la idea, Bogofilter y Bayespam, para GNU/Linux, en versiones beta. Graham trabaja en Arc, un lenguaje de programación con el que piensa crear un filtro para el correo electrónico.

Según recientes estudios, el correo basura representa el 36% de los mensajes que reciben los internautas.

Suscríbete para seguir leyendo

Archivado En