summaryrefslogtreecommitdiffstats
path: root/statistik
diff options
context:
space:
mode:
Diffstat (limited to 'statistik')
-rw-r--r--statistik/Leipzig/README.txt3
-rw-r--r--statistik/README.txt10
2 files changed, 12 insertions, 1 deletions
diff --git a/statistik/Leipzig/README.txt b/statistik/Leipzig/README.txt
index 173939e..428ab90 100644
--- a/statistik/Leipzig/README.txt
+++ b/statistik/Leipzig/README.txt
@@ -1,4 +1,5 @@
-Diese Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
+== häufigste*.txt ==
+Die Dateien basieren auf der von der Uni Leipzig erstellten Liste der 10000
häufigsten Wörter (bzw. Wortformen) der deutschen Sprache¹.
Groß- und Kleinschreibung sowie Sonderzeichen (Bindestriche, Leerzeichen,
Apostrophe, Buchstaben mit Akzenten, Zahlen, …) wurden ignoriert.
diff --git a/statistik/README.txt b/statistik/README.txt
new file mode 100644
index 0000000..dc9056e
--- /dev/null
+++ b/statistik/README.txt
@@ -0,0 +1,10 @@
+== Korpusse ==
+Die Dateien in diesem Verzeichnis wurden als statistische Basis für die
+computergestützte Optimierung von Tasturlayouts erstellt, derzeitig gibt es
+• den Leipziger Korpus (in /leipzig),
+• und eine Überarbeitung davon (in /Leipzig-Karl)
+
+=== Programm zur Auswertung ==
+Um aus einem Korpus unter GNU/Linux N-Gramme zu generieren, siehe:
+• http://permalink.gmane.org/gmane.comp.hardware.keyboards.layout.neo/4602
+• http://lists.neo-layout.org/pipermail/diskussion/2009-December/015238.html