Die Worthäufigkeit ist ein Maß für die Häufikeit mit der ein Wort in einem Text oder Text-Corpus vorkommt.
Die Worthäufigkeit kann man in absoluten Werten oder in Relation zur Gesamtanzahl der Wörter im Text oder Corpus berechnen.
Project Gutenberg |
||
Rank |
Word |
Count |
1 |
the |
56271872 |
2 |
of |
33950064 |
3 |
and |
29944184 |
4 |
to |
25956096 |
5 |
in |
17420636 |
6 |
I |
11764797 |
7 |
that |
11073318 |
8 |
was |
10078245 |
9 |
his |
8799755 |
10 |
he |
8397205 |
Films / TV |
||
Rank |
Word |
Count |
1 |
you |
1222421 |
2 |
I |
1052546 |
3 |
to |
823661 |
4 |
the |
770161 |
5 |
a |
563578 |
6 |
and |
480214 |
7 |
that |
413389 |
8 |
it |
388320 |
9 |
of |
332038 |
10 |
me |
312326 |