Selecciona Edición
Entra en EL PAÍS
Conéctate ¿No estás registrado? Crea tu cuenta Suscríbete
Selecciona Edición
Tamaño letra
OPINIÓN

La ley de Zipf

El lingüista norteamericano George Zipf, muerto en 1950, formuló la ley de Zipf para las frecuencias de las palabras en los textos en inglés. La palabra más común, the, aparece el doble de veces que la segunda, of, el triple que la tercera, el cuádruple que la cuarta y así. Pero es aplicable a muchos otros fenómenos. El último que han descubierto es el ajedrez: la jugada más usada ocurre el doble de veces que la segunda más usada, el triple que la tercera; en fin, la ley de Zipf.

El mundo tiene 6.800 millones de habitantes y 15.000 millones de páginas web. La cuenta da más de dos páginas por terrícola, pero eso es una media que no dice gran cosa. La arquitectura de la Red, como los lenguajes y el ajedrez, obedece a una distribución "libre de escala", la generalización actual de la ley de Zipf.

Si la página web más conectada recibe dos millones de links, la segunda no recibe la mitad (un millón), como diría Zipf, sino la cuarta parte (medio millón). En vez de ser inversamente proporcional a su posición en el ranking, lo es a su cuadrado. En otros tipos de red lo es al cubo, y en la mayoría de redes muestra un comportamiento intermedio.

Lo primero que tienen en común todas estas arquitecturas es su tremenda injusticia en el reparto de rangos. Unos pocos nodos acaparan casi todos los nexos; y casi todos los nodos se tienen que conformar con unos pocos nexos. En el caso de Internet, "unas pocas páginas hiperconectadas son prácticamente las que mantienen junta la red", como dice el físico Albert-László Barabási. El 80% de las páginas web tiene menos de cuatro links, y sólo una página de cada 10.000 tiene más de mil links.

Estas redes se llaman "libres de escala" porque cada barrio periférico, y cada suburbio ultraperiférico, tiene el mismo aspecto que la red en su conjunto. Los jefes de barrio tienen muchos menos links que los grandes centros globales, pero guardan la misma proporción con sus vecinos. A cualquier escala hay unos pocos nodos que acaparan la mayoría de las conexiones.

Las redes libres de escala son mundillos (small worlds), porque bastan unos pocos pasos para enlazar cualquier nodo con cualquier otro, por alejado que esté. En una red de un millón de nodos, bastan seis pasos (el número de ceros de un millón). En Internet, que tiene 15.000 millones de páginas, bastan 10 pasos. La razón es que el enlace se orienta viajando a través de una jerarquía de nodos.

Éste es el fundamento de uno de los números favoritos de los humoristas: conectar a dos actores con seis pasos. Los actores de Hollywood, en efecto, son un mundillo en el sentido matemático. Aquí los nodos son los actores, y los nexos consisten en compartir reparto en una película. Por alguna razón, dos de los actores más hiperconectados son Donald Pleasence y Rod Steiger, con miles de links. Steiger intervino en más de 120 películas. También son mundillos la red eléctrica y la literatura científica, donde los nexos son las citas que recibe un artículo.

Una reflexión de Borges: "En el centro puntual de la maraña / hay otro prisionero: Dios, la araña".

* Este articulo apareció en la edición impresa del Domingo, 13 de diciembre de 2009