Finalement, il n'était pas aussi décevant que je le pensais que 635 mots représentent 87% du Nouveau Testament :
[…] la loi de Zipf, selon laquelle la fréquence d'un terme, quel qu'il soit, est inversement proportionnelle à son rang dans la table de fréquence. C'est ainsi que le mot le plus fréquent aura un nombre d'occurences à peu près double de celui du second mot le plus fréquent, et triple de celui du mot venant en troisième position. En conséquence, cent-trente-cinq mots à peine suffisent à rendre compte de la moitié des occurences dans un corpus de langue anglaise d'environ un million de mots.

David Bellos, Le Poisson et le Bananier, p. 364 (note 2 du chapitre 8), Flammarion 2012