INVESTIGACIÓN

Algoritmos genéticos aislan el 96,5% del correo basura

Una técnica originalmente diseñada para analizar el ADN puede ser la solución a la plaga del correo basura, tras descubrirse que el spam utiliza secuencias de letras y símbolos similares a los de los aminoácidos y fragmentos del código genético.

Los resultados de la investigación fueron presentados por científicos de IBM

en la primera conferencia sobre correo electrónico y antispam, celebrada el pasado mes de julio.

Se trata de un algoritmo genético capaz de identificar y aislar hasta el 96,5% del spam que inunda Internet. Chung Kwei, así se llama, está basado en otro algoritmo, Teiresias, también desarrollado por los bioinformáticos de IBM para identificar diferentes secuencias de aminoácidos y fragmentos de ADN. Teiresias descubrió patrones y pudo aislar el funcionamento de ciertas estructuras genéticas; después fue modificado y dio como resultado Chung Kwei, que debe su nombre a un talismán feng shui para combatir los malos espíritus. Su misión no es perseguir secuencias orgánicas sino identificar cadenas de caracteres que se repiten en los correos basuras. Así, los investigadores alimentaron el algoritmo con 65.000 ejemplos de correo basura conocido. Cada uno de ellos fue considerado como una secuencia del ADN y detectó seis millones de patrones diferentes. Cada patrón representaba un secuencia común de letras y números que había aparecido en más de un mensaje no deseado.

IBM incluirá la técnica en sus programas contra el spam, aunque todavía debe superar algunas pruebas de laboratorio.

IBM: www.ibm.es

* Este artículo apareció en la edición impresa del 0015, 15 de septiembre de 2004.

Lo más visto en...

Top 50