IBM usa técnicas de análisis genético para filtrar el 'spam'
Ha creado un algoritmo para los correos basura partiendo de otro que aplicado a investigar proteínas
El envío masivo de correos no solicitados es una plaga que afecta a casi todos los internautas. Pese a las técnicas de filtrado existentes, muchas empresas trabajan en nuevas soluciones, pero lo que pocos podían imaginar es que los trabajos de Crick y Watson sobre la secuenciación molecular servirían para combatir el 'spam'. Biólogos computacionales del Centro de Investigación TJ Watson de IBM aseguran haber desarrollado un filtro anti-spam siguiendo el camino que esos investigadores usaron para analizar secuencias genéticas.
Según cuenta hoy Cinco Días, el nuevo sistema aún tiene que pasar algunas pruebas piloto antes de que vigile las bandejas de entrada de los correos de los usuarios, pero la tecnología desarrollada promete buenos resultados. La nueva herramienta aprende automáticamente pautas propias del vocabulario del 'spam'. Y su eficacia ha demostrado ser de un 96,5%.
Los bioinformáticos de IBM Isidore Rigoutsos y Tien Huynh comenzaron a idear el algoritmo en el que se basa el nuevo filtro hace algo más de un año, y le han bautizado con el nombre de Chung-Kwei. La BBC informa de que los investigadores crearon su algoritmo partiendo de otro que se aplicaba a la investigación sobre las proteínas. Pero en lugar de identificar elementos propios de éstas, IBM sustituyó estos elementos por secuencias de caracteres que aparecen únicamente en mensajes de 'spam'. 'Obviamente, los algoritmos son aplicables a un vasto rango de problemas', explica Rigoutsos.
El nuevo sistema funciona considerando los correos como un conjunto de palabras y combinaciones de letras y símbolos. Mediante el análisis de dos colecciones de e-mails, una de 'spam' y otra de correo bueno, crea diccionarios con las combinaciones más frecuentes en cada uno. Así, es capaz de analizar y comparar cada mensaje con estos diccionarios, estableciendo un umbral a partir del cual los que lo superen son considerados 'spam' y marcados como tal.
Según reconoce Rigoutsos, su trabajo se ayudó de los grandes volúmenes de 'spam' que él y sus colegas reciben en sus puestos de trabajo. 'Hemos experimentado con grandes colecciones de e-mails. Tenemos 66.000 mensajes que son 'spam' y 22.000 que no lo son', añade Rigoutsos, quien explica que 'entrenar 88.000 mensajes lleva aproximadamente 15 minutos en un procesador simple. Si una hora más tarde tenemos más 'spam', podemos añadirlo a la colección para seguir aprendiendo cada vez más'. En pruebas recientes el filtro sólo falló en la identificación de un mensaje de entre un total de 6.000 correos basura.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.
Archivado En
Últimas noticias
Rally Dakar: Recorrido, etapas y resultados
Un bar, una fiesta con bengalas y decenas de muertos: cómo avanza la investigación de la tragedia de Suiza
Miniguía para elegir un buen roscón de Reyes (y quizá dejar de pensar que está sobrevalorado)
El primer fin de semana del año llega con frío, lluvia y nieve y la culpa la tiene Francis
Lo más visto
- Trump avisa de que está preparado para atacar Irán si sigue la represión de las protestas y Teherán amenaza con “caos en toda la región”
- Ayuso bendice un campus universitario de los ‘kikos’ y del Comité Olímpico Español rechazado en cuatro ciudades españolas
- Sergio Ramos lidera a un grupo de inversores para comprar el Sevilla
- Cuerpo anuncia que en enero se aprobará la norma que limita los intereses del crédito al consumo
- El comandante Kapustin no estaba muerto: así fue el montaje del espionaje ucranio para engañar a Rusia




























































