Häufigkeitsanalyse
Einführung
Ein möglicher Anasatz der Kryptoanalyse ist die Untersuchung der Häufigkeiten von Buchstaben und n-Grammen. Die Haufikeitsanalyse macht sich die Gesetzmäßigkeiten der Sprache Zunutze. Jede Sprache hat Normen und kann auch durch geschickte Chiffrierung nicht vollständig beseitigt werden.
Die Gesamtheit der Häufigkeiten der einzelnen Buchstaben (oder Buchstabengruppen) eines Textes im Verhältnis zum Gesamttext wird Häufigkeitsverteilung genannt. Sie wird meist in pro 100 (Prozent) oder pro 1000 (Promille) angegeben.
Die Häufigkeit der Buchstaben ist für eine Sprache charakteristisch. So ist das 'E' im deutschen mit einer Häufigkeit von 17,4% der meist verwendete Buchstabe. Im englischen dagegen hat das 'E' nur einen Anteil von 12,5%. Ein ausführlicher Artikel über die Häufigkeit von Buchstaben findet sich unter https://de.wikipedia.org/wiki/Buchstabenh%C3%A4ufigkeit.