George Kingsley Zipf amerikai nyelvész a múlt század derekán azt vette észre, hogy a szavak eloszlása ugyanazt a mintát követi ha újságcikket, könyvet, vagy bármilyen más szöveget vizsgál. Zipf megszámolta, hogy az egyes szavak hányszor bukkannak fel és arra jutott, a szavak gyakoriságuk szerint rangsorba állíthatók. Egészen pontosan, a leggyakrabban előforduló szó körülbelül kétszer olyan gyakran bukkan fel, mint a második leggyakoribb szó. A második leggyakoribb szó pedig körülbelül kétszer olyan gyakran fedezhető fel egy elegendően terjedelmes szövegben, mint a negyedik leggyakoribb szó és így tovább.