_
_
_
_
_
Reportaje:

Un ordenador repartido por todo el mundo

Decenas de miles de computadores coordinados tratarán los datos del acelerador LHC

Decenas de miles de ordenadores personales almacenarán y analizarán los datos que producirán los experimentos del nuevo acelerador de partículas LHC, que empezará a funcionar en 2007 en el Laboratorio Europeo de Física de Partículas (CERN), junto a Ginebra. Serán unos 14 petabytes de información al año, el equivalente a más de 20 millones de CD, o el 1% de la cantidad anual de información producida en el mundo actualmente. Es algo sin precedentes y sólo la computación distribuida podrá con tal avalancha de datos y cómputos. La solución se llama Grid, es muy eficaz y barata en comparación con los superordenadores, y se está desarrollando en todo el mundo para múltiples aplicaciones futuras.

En Ginebra habrá 25.000 ordenadores personales sin pantalla ni teclado
El reto del Grid es tratar rápidamente ingentes cantidades de información

En concreto, el programa del LHC, que lleva la delantera, se denomina LCG y es una de las dos aplicaciones piloto de un programa más amplio EGEE (Enabling Grids for E-science in Europe), financiado mayoritariamente por la UE con 32 millones de euros. La otra aplicación piloto, más atrasada en su desarrollo, se dedica a biomedicina. EGEE es un proyecto de cuatro años (2004-2007) en el que participan 27 países y que supone la ampliación y profundización del anterior, Datagrid, liderado por el CERN, que se centró en el prototipo del nuevo sistema.

El LCG tiene que lograr que el Grid funcione a gran escala, tiene que arrancar esa galaxia de ordenadores diferentes repartidos por todo el mundo y conectados a la máxima velocidad posible. "De hecho, el Grid ya funciona, y muy bien; ahora tiene que crecer", dice François Grey, portavoz del Openlab del CERN, una iniciativa de colaboración con empresas de informática para el Grid.

Las salas del centro de cálculo del laboratorio de Ginebra se están ampliando para alojar baterías de ordenadores personales (sin monitor ni teclado, por supuesto). Ya hay 5.000 en las estanterías, "pero habrá 25.000 sólo aquí, cuando el LHC empiece a funcionar, y unos 100.000 en todo el mundo", continúa Grey.

Las pruebas de LCG han sido todo un éxito, incluso con comunicación transatlántica ultrarrápida, y en los últimos meses, explica Gray, se están haciendo ya simulaciones de lo que serán los experimentos del acelerador. La comunicación ultrarrápida es importante porque el reto del Grid es, más que nada, mover las ingentes cantidades de información rápidamente de unos ordenadores a otros. "En realidad lo más difícil ha sido acordar estándares", dice Grey, porque cada miembro del Grid utilizará la máquina que tenga o que desee. La idea es aprovechar toda la capacidad de almacenamiento de datos y cálculo posible, distribuida por donde esté. Es un avance revolucionario de la ya de por sí revolucionaria World Wibe Web (www), que nació precisamente en el CERN (inventada por Tim Berners-Lee) hace algo más de una década. Pero si la www da acceso a información distribuida, el Grid distribuye también la computación y el almacenamiento de información.

En líneas muy generales, el LCG funcionará así: los datos generados en los experimentos del acelerador (en 40 millones de colisiones de partículas por segundo) pasarán un primer filtro en los propios detectores y la información conservada (unas 100 colisiones por segundo, que sumarán esos 12 o 14 petabytes anuales de datos) se almacenará en miles de unidades diferentes de centros de todo el mundo, que se ocuparán también del proceso de datos, distribuyendo y compaginando tareas.

Así, cuando un físico -y serán varios miles de científicos los participantes en LHC- trabaje en el análisis de los experimentos no necesitará saber dónde están los datos ni qué ordenadores los están procesando, igual que cuando uno recaba información en la www no tiene que saber dónde está almacenada ni qué ordenador se la proporciona. "El truco es virtualizar todos los recursos", comenta Manuel Delfino, director del nodo español de este Grid.

"Grid es un conjunto de ordenadores paralelos y dispositivos interconectados que son heterogéneos, pero que van a parecer homogéneos desde el punto de vista del usuario", recuerda Vicky White, jefa de la División de Computación de Fermilab (Chicago, EE UU). Otras comunidades científicas, como las de genética y proteómica, que también necesitan trabajar con enormes almacenes de información, se apuntan ya al Grid porque en sus aplicaciones potenciales "sólo la imaginación y la madurez tecnológica son ahora el límite y en el futuro sólo lo será la imaginación", afirma Delfino.

El Grid y los supercomputadores no se hacen la competencia, sino que se complementan, explica Delfino, y el superordenador de Barcelona colaborará en esta red. Hay problemas, como la modelización aeronáutica, que exigen una velocísima comunicación entre procesadores, que son más aptos para las supercomputadoras. Sin embargo, el Grid resuelve de maravilla los retos que suponen ingentes cantidades de información.

El centro de cálculo de CERN está siendo ampliado para alojar los miles de ordenadores del sistema Grid.
El centro de cálculo de CERN está siendo ampliado para alojar los miles de ordenadores del sistema Grid.CERN
Simulación del detector Atlas del acelerador LHC en la que una partícula Higgs se desintegra en cuatro muones.
Simulación del detector Atlas del acelerador LHC en la que una partícula Higgs se desintegra en cuatro muones.CERN

Nodo en España

Además del nodo cero del Grid LCG, ubicado en el CERN, hay otros 11 nodos en el proyecto y uno de ellos está en Barcelona, en el recién creado Puerto de Información Científica (PIC). "En cada uno de estos nodos se almacenará casi toda la información del LHC y en ellos se realizará bastante proceso de datos", explica Enrique Fernández, director del Instituto de Física de Altas Energías (IFAE). Por ahora están instalados allí más de 200 ordenadores personales, pero cuando arranque el nuevo acelerador y empiecen a generarse las ingentes cantidades de datos, habrá unos mil. "Todo depende de la evolución tecnológica", dice Manuel Delfino, director del centro de Barcelona. "Cada PC llevará dos procesadores, así que tendremos el equivalente a 2.000 y con el doble de velocidad".

Al Grid no llegarán todos los registros generados en las colisiones de partículas del LHC porque el sistema tiene varios niveles de filtro, explica Fernández. El primero va asociado a los propios detectores prácticamente como hardware y eliminará la información que no interesa para la física. Sólo llegarán los datos de choques potencialmente interesantes.

Los grupos españoles colaboran en este Grid desde el principio. "Todos los que están en el LHC participan en el desarrollo de Grid", comenta Fernández. El PIC, auspiciado por el IFAE, es un centro asociado del Ciemat, la Universidad Autónoma de Barcelona, el Departamento de Investigación de la Generalidad catalana y el IFAE.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_