diff options
author | dennis <dennis@b9310e46-f624-0410-8ea1-cfbb3a30dc96> | 2010-05-06 17:50:21 +0000 |
---|---|---|
committer | dennis <dennis@b9310e46-f624-0410-8ea1-cfbb3a30dc96> | 2010-05-06 17:50:21 +0000 |
commit | d18febecd97f51537c09d1f944daf4d37567ebb9 (patch) | |
tree | fc83e17d08834e75a6be3e3223f55edd6002ae57 /statistik | |
parent | c44aae56c7bbbe6b2d57e48c72280d223c1ea11a (diff) |
Gemeinsame README für die Korpusse angelegt.
git-svn-id: https://svn.neo-layout.org@2323 b9310e46-f624-0410-8ea1-cfbb3a30dc96
Diffstat (limited to 'statistik')
-rw-r--r-- | statistik/Leipzig/README.txt | 3 | ||||
-rw-r--r-- | statistik/README.txt | 10 |
2 files changed, 12 insertions, 1 deletions
diff --git a/statistik/Leipzig/README.txt b/statistik/Leipzig/README.txt index 173939e..428ab90 100644 --- a/statistik/Leipzig/README.txt +++ b/statistik/Leipzig/README.txt @@ -1,4 +1,5 @@ -Diese Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000 +== häufigste*.txt == +Die Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000 häufigsten Wörter (bzw. Wortformen) der deutschen Sprache¹. Groß- und Kleinschreibung sowie Sonderzeichen (Bindestriche, Leerzeichen, Apostrophe, Buchstaben mit Akzenten, Zahlen, …) wurden ignoriert. diff --git a/statistik/README.txt b/statistik/README.txt new file mode 100644 index 0000000..dc9056e --- /dev/null +++ b/statistik/README.txt @@ -0,0 +1,10 @@ +== Korpusse == +Die Dateien in diesem Verzeichnis wurden als statistische Basis für die +computergestützte Optimierung von Tasturlayouts erstellt, derzeitig gibt es +• den Leipziger Korpus (in /leipzig), +• und eine Überarbeitung davon (in /Leipzig-Karl) + +=== Programm zur Auswertung == +Um aus einem Korpus unter GNU/Linux N-Gramme zu generieren, siehe: +• http://permalink.gmane.org/gmane.comp.hardware.keyboards.layout.neo/4602 +• http://lists.neo-layout.org/pipermail/diskussion/2009-December/015238.html |