Ley de Zipf

La ley de Zipf , en probabilidad, afirma que las frecuencias f de ciertos eventos son inversamente proporcionales a su rango r . La ley fue propuesta originalmente por el lingüista estadounidense George Kingsley Zipf (1902-1950) para la frecuencia de uso de diferentes palabras en el idioma inglés; esta frecuencia viene dada aproximadamente por f ( r ) ≅ 0.1 / r . Por tanto, la palabra más común (rango 1) en inglés, que es el , aparece aproximadamente una décima parte del tiempo en un texto típico; la siguiente palabra más común (rango 2), que es de , aparece aproximadamente en una vigésima parte del tiempo; Etcétera. Otra forma de ver esto es que una palabra de rango r ocurre 1 /r veces más que la palabra más frecuente, por lo que la palabra de rango 2 aparece la mitad de la frecuencia que la palabra de rango 1, la palabra de rango 3 un tercio de la frecuencia, la palabra de rango 4 un cuarto de la frecuencia, y así sucesivamente. Más allá del rango 1,000, la ley se rompe por completo.

La ley de Zipf supuestamente se ha observado para muchas otras estadísticas que siguen una distribución exponencial. Por ejemplo, en 1949 Zipf afirmó que la ciudad más grande de un país es aproximadamente el doble del tamaño de la siguiente más grande, tres veces el tamaño de la tercera más grande, y así sucesivamente. Si bien el ajuste no es perfecto para idiomas, poblaciones o cualquier otro dato, la idea básica de la ley de Zipf es útil en los esquemas de compresión de datos y en la asignación de recursos por parte de los planificadores urbanos.

William L. Hosch