Proporciones desconcertantes
¿En qué proporción están las respectivas poblaciones de la primera ciudad en número de habitantes y la segunda, la tercera, la cuarta…?
Los desconcertantes números aleatorios de la semana pasada dieron lugar a interesantes comentarios de mis amables lectoras/es. A la pregunta: “¿Por qué es más probable que el número de habitantes de una ciudad empiece por 1 que por 9?”, Jonathan Arnold contesta (presumiblemente desde un país de habla inglesa, a juzgar por su nombre y por la ausencia de tildes en su texto):
“Si pensamos en la población de un núcleo urbano de, por ejemplo, 800 o 900 habitantes, le hará falta incrementar la población en 100 a 200 habitantes para alcanzar la cifra de 1.000 habitantes, número que comienza con un 1. A partir de ahí, hará falta aumentar la población con 1.000 habitantes para que el primer número pase de n a n+1″.
Y Xoaquín Fernández añade:
“Si aplicamos la ley de Zipf por tramos de población (de 10.000 a 99.999; de 100.000 a 999.999…) podríamos explicar bien el resultado. Para cada tramo el número de poblaciones en el segmento inicial es mayor que en el siguiente. Mi explicación haría hincapié en las economías de aglomeración a partir de una distribución inicial de la población más equilibrada; sería un proceso acumulativo, que iría seleccionando, a veces por azar, algún punto, y reforzándolo”.
La ley de Zipf fue formulada a mediados del siglo pasado por el lingüista estadounidense George K. Zipf, que aplicó el análisis estadístico al estudio de diferentes lenguas y halló que la frecuencia de aparición de las palabras sigue una pauta similar a la establecida por la ley de Benford-Newcomb (pero ese es otro artículo).
Por su parte, Adelaida López trae a colación una interesante anécdota en relación con el tema que nos ocupa:
“Existen astucias estadísticas sencillas para detectar cierto tipo de fraudes. Por ejemplo, Hill (el primero en formalizar matemáticamente la ley de Benford) propuso a sus alumnos el ejercicio, para casa, de lanzar una moneda 200 veces al aire y anotar cuándo salía cara y cuándo cruz. Los más perezosos, y tramposos, no se tomaron la molestia de lanzar realmente 200 veces la moneda y anotaron aleatoriamente cara y cruz de forma bastante uniforme, pero a ninguno se le ocurrió anotar 6 veces seguidas cara o cruz, pues intuitivamente no consideraron probable que se dieran series consecutivas tan largas, lo cual es falso cuando se realizan 200 lanzamientos reales. Por ese fallo detectó Hill a los tramposos”.
De hecho, la probabilidad de que al tirar una moneda 200 veces salgan en algún momento 6 caras o 6 cruces seguidas es del 96 % aproximadamente (¿puedes calcularla?), por lo que una distribución demasiado uniforme de caras y cruces era una señal (casi) segura de haber hecho trampa.
Contando palabras, apellidos, personas…
En próximas entregas nos ocuparemos (no es plural mayestático: cuento, como de costumbre, con la colaboración de mis sagaces lectoras/es) de la antes citada ley de Zipf (y del principio de Pareto, con el que está estrechamente relacionada) y, como precalentamiento, te propongo el siguiente ejercicio: elige un texto cualquiera de cierta extensión (un capítulo de un libro, un relato, un artículo largo…), anota el número de veces que aparecen las cinco palabras más frecuentes e intenta establecer una relación entre dichas frecuencias. Si la onomástica te atrae más que la lingüística, puedes hacer lo propio con los cinco apellidos más frecuentes. O con cualquier otro conjunto que se preste a ordenar sus subconjuntos por el número de elementos, como las poblaciones de las ciudades más populosas de un país.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.