Dos científicos españoles dibujan el mapa gráfico del genoma de la empresa Celera
La revista 'Science' distribuye la primera representación del código del ser humano
El póster elaborado por Guigó y Abril ha sido generado con el programa informático gff2ps (del inglés General Feature Formatted to PostScript) desarrollado durante 1999 en los laboratorios del IMIM en Barcelona. Una versión de este mismo programa, distribuido en Internet para su uso libre por cualquier laboratorio especializado en secuenciación genómica, ya se había utilizado con anterioridad para dar forma al genoma de la mosca del vinagre, igualmente publicada por Science.
'El programa permite integrar miles de datos y obtener una representación gráfica', relata Guigó. Algo que, añade Abril, no es tan trivial. 'Nos sentimos como los primeros cartógrafos', compara. La comparación, dicen ambos, tiene sentido. Los cartógrafos del pasado recopilaban infinidad de datos sobre tierras desconocidas con el objetivo de elaborar un mapa que reflejara los más fidedignamente posible la realidad. Y eso es lo que han tratado de hacer con el genoma humano por encargo de Celera. Sólo que los datos se cuentan por millones y la realidad a contar es mucho más abstracta.
El póster de los bioinformáticos catalanes resume los 3.000 millones de pares de bases del genoma humano y los algo más de 38.000 genes predichos por Celera. Dado el volumen de información recogida y el que pretendía ofrecerse, Guigó y Abril idearon un algoritmo informático que permitiera reproducir a un tiempo una visión de conjunto del genoma y amplificara automáticamente la estructura de cada uno de los genes, especialmente, el área que codifica la expresión de proteínas, los llamados exones.
Este planteamiento, expresado por el propio fundador de Celera, Craig Venter, les llevó a idear un mecanismo de visualización de datos basado en dos escalas. En la primera se trabaja a un nivel de resolución de 600.000 bases químicas por centímetro o, lo que es lo mismo, se representan el equivalente a más de medio millón de letras en un solo centímetro. De este modo pueden representarse cajas equivalentes a los genes, al tiempo que visualizar gracias a un código de colores e iconográfico qué tipo de genes son, cual es su función conocida, la distancia entre ellos y cómo se agrupan.
En la segunda la escala, concebida a modo de zoom, la resolución es de 30.000 bases por centímetro. Con ella se logra ver la estructura de cada uno de los genes. El resultado final es un póster de 100 centímetros de ancho por 140 de largo.
Las claves del programa gff2ps, resumen los científicos del IMIM, son fundamentalmente su capacidad para manejar enormes volúmenes de datos de origen biológico y traducirlos a un formato, el Post Script, que permite elaborar gráficos vectoriales y presentarlos de forma escalable, es decir, en distintos tamaños de acuerdo con los requerimientos del usuario o de las capacidades de los dispositivos de impresión. 'El formato', puntualiza Abril, 'permite imprimir indistintamente en una hoja de papel o, si existiera una impresora suficientemente grande, en una superficie equivalente a un edificio de varias plantas'.
Pese al éxito, Guigó y Abril no ven el diseño y la visualización de datos como parte central. 'Nuestra colaboración con Celera fue puramente académica y para un desarrollo concreto', puntualiza Guigó, responsable del área bioinformática del IMIM. 'Teníamos el programa a punto en el momento preciso', añade Abril. Los principales desarrollos del departamento, matizan, corresponden a programas (software) pensados para el análisis y la predicción de genes, campo en el que han puesto a punto productos que se emplean en distintos laboratorios del mundo.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.