IBM usa técnicas de análisis genético para filtrar el 'spam'
Ha creado un algoritmo para los correos basura partiendo de otro que aplicado a investigar proteínas
El envío masivo de correos no solicitados es una plaga que afecta a casi todos los internautas. Pese a las técnicas de filtrado existentes, muchas empresas trabajan en nuevas soluciones, pero lo que pocos podían imaginar es que los trabajos de Crick y Watson sobre la secuenciación molecular servirían para combatir el 'spam'. Biólogos computacionales del Centro de Investigación TJ Watson de IBM aseguran haber desarrollado un filtro anti-spam siguiendo el camino que esos investigadores usaron para analizar secuencias genéticas.
Según cuenta hoy Cinco Días, el nuevo sistema aún tiene que pasar algunas pruebas piloto antes de que vigile las bandejas de entrada de los correos de los usuarios, pero la tecnología desarrollada promete buenos resultados. La nueva herramienta aprende automáticamente pautas propias del vocabulario del 'spam'. Y su eficacia ha demostrado ser de un 96,5%.
Los bioinformáticos de IBM Isidore Rigoutsos y Tien Huynh comenzaron a idear el algoritmo en el que se basa el nuevo filtro hace algo más de un año, y le han bautizado con el nombre de Chung-Kwei. La BBC informa de que los investigadores crearon su algoritmo partiendo de otro que se aplicaba a la investigación sobre las proteínas. Pero en lugar de identificar elementos propios de éstas, IBM sustituyó estos elementos por secuencias de caracteres que aparecen únicamente en mensajes de 'spam'. 'Obviamente, los algoritmos son aplicables a un vasto rango de problemas', explica Rigoutsos.
El nuevo sistema funciona considerando los correos como un conjunto de palabras y combinaciones de letras y símbolos. Mediante el análisis de dos colecciones de e-mails, una de 'spam' y otra de correo bueno, crea diccionarios con las combinaciones más frecuentes en cada uno. Así, es capaz de analizar y comparar cada mensaje con estos diccionarios, estableciendo un umbral a partir del cual los que lo superen son considerados 'spam' y marcados como tal.
Según reconoce Rigoutsos, su trabajo se ayudó de los grandes volúmenes de 'spam' que él y sus colegas reciben en sus puestos de trabajo. 'Hemos experimentado con grandes colecciones de e-mails. Tenemos 66.000 mensajes que son 'spam' y 22.000 que no lo son', añade Rigoutsos, quien explica que 'entrenar 88.000 mensajes lleva aproximadamente 15 minutos en un procesador simple. Si una hora más tarde tenemos más 'spam', podemos añadirlo a la colección para seguir aprendiendo cada vez más'. En pruebas recientes el filtro sólo falló en la identificación de un mensaje de entre un total de 6.000 correos basura.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.
Archivado En
Últimas noticias
Javier López Zavala, declarado culpable del feminicidio de Cecilia Monzón
Kast intenta sumar a Ecuador en su idea de abrir un corredor humanitario para devolver a migrantes irregulares a Venezuela
Estados Unidos advierte que privará a Maduro de “los recursos que usa para financiar” el narcotráfico
México pide ante la ONU una solución “pacífica, democrática y negociada” para la crisis en Venezuela
Lo más visto
- El PP de Almeida vota en contra de dedicarle a Robe Iniesta un centro juvenil porque antes quiere hablarlo con su familia
- Comprobar Lotería de Navidad 2025: consulta la pedrea con la lista de números premiados
- Trump anuncia la construcción de un nuevo tipo de buques de guerra que llevarán su nombre: “Serán los más grandes y poderosos de la historia”
- “¿Qué se siente al ser un fracaso?“: cómo la protagonista de ‘Showgirls’ superó la humillación y abrazó la película
- El Gobierno y Bildu acuerdan extender a 2026 la prohibición de desahuciar a personas vulnerables




























































