Peter Sedlmeier führte an der Universität Salzburg ein Experiment zur Lückentextergänzung durch. Hierbei wurden zwei studentischen Versuchspersonengruppen mit jeweils etwa 30 Teilnehmern Fragebogen mit zwölf Sätzen oder kurzen Textauszügen vorgelegt, in denen jeweils ein fehlendes Inhaltswort (Substantiv, Adjektiv oder Verb) ergänzt werden sollte. Die Textauszüge waren aus Artikeln der Wochenzeitung ``Die Zeit'' ausgewählt worden. In beiden Fragebogen waren jeweils vier Textauszüge identisch. Die weiteren acht Textauszüge unterschieden sich in der Länge des vorgegebenen Kontextes. So wurde etwa der einen Versuchspersonengruppe der Auszug ``Gemütlich sitzen sie zusammen bei Cognac und Rotwein und blicken hinab auf die [Erde].'' vorgelegt, der anderen hingegen ``Ein Vorspiel im Himmel - wie es sich für ein deutsches Literaturwerk gehört: Gott und der Teufel sind in die Jahre gekommen. Gemütlich sitzen sie zusammen bei Cognac und Rotwein und blicken hinab auf die [Erde].''
Gemittelt über alle 20 unterschiedlichen Lückentexte entschieden sich
durchschnittlich 22,7% der Versuchspersonen für das im Originaltext
vorgesehene Wort. Bei ausschließlicher Betrachtung der acht Kurzversionen
waren es 8,4% der Versuchspersonen, bei Betrachtung der zugehörigen Langversionen
hingegen 41,75%. Offenbar trägt bei den betrachteten Textauszügen
ein erweiterter Kontext stark zu einer verbesserten Vorhersage bei.
Demgegenüber berücksichtigt die hier vorgestellte Methode zur Simulation
der Lückentextergänzung in aller Regel nur den unmittelbaren Kontext
einer Textlücke: Ob die Kurz- oder Langversionen der Sätze betrachtet
werden, führt nur dann zu einem unterschiedlichen Ergebnis, wenn sich der
in der Langversion hinzukommende zusätzliche Text unmittelbar an die
Textlücke anschließt. Dies wirkte sich aber bei den hier verwendeten
Beispielen nicht auf das Ergebnis aus. Die mit den
20 Textauszügen durchgeführte Computersimulation ergab unter Verwendung des
in Kapitel
angegebenen Korpus für die fehlenden
Wörter einen Median von 53 bei einem Vokabular von 65 356 Wörtern.
Dieser gute Wert täuscht jedoch darüber hinweg,
daß bei 9 der 20 Vorhersagen Rangplätze von weit über 200 produziert wurden.