next up previous contents index
Next: Zusammenfassung Up: Die Berechnung von Wortassoziationen Previous: Simulationsergebnisse

Diskussion

Es gibt eine Reihe von Möglichkeiten, die erhaltenen Ergebnisse weiter zu verbessern. Bei Verwendung eines geeigneten Korpus erscheint es sogar möglich, daß die vorausgesagten assoziativen Antworten schließlich eine stärkere Übereinstimmung mit dem Durchschnitt der Versuchspersonen aufweisen als die Antworten einer einzelnen Versuchsperson. Hierzu müßte aber die Repräsentativität  des Korpus erheblich verbessert werden. Einerseits sollte der Anteil gesprochener Sprache erhöht werden, um auch aus der Umgangssprache resultierende Assoziationen (etwa tex2html_wrap_inline23527 ) simulieren zu können. Weiterhin erscheint eine beträchtliche Erweiterung des Gesamtumfangs erforderlich. Die durchschnittliche Korpushäufigkeit der Stimuluswörter im Experiment nach Russell & Meseck liegt zwar bei über 1000, die Streuung ist jedoch erheblich. Die in der Korpuslinguistik gelegentlich geforderte Mindesthäufigkeit von 100 wird von einigen Stimuluswörtern nicht erreicht. Dazu gehören geläufig erscheinende Wörter wie Bequemlichkeit, Schmetterling, kommandieren, rauh, Spinne, Nadel, Hammelfleisch, Stiel, Ofen u. a. Tabelle gif zeigt, daß die vorhergesagten Assoziationen zu diesen Wörtern zumeist unbefriedigend sind.

Eine Stammformenreduktion  und eine Zerlegung von Komposita  würde die Korpushäufigkeiten sicherlich erhöhen, allerdings den Vergleich mit den Assoziationen von Versuchspersonen problematisch machen, da diese nicht immer mit Stammformen antworten. Eine einfache Möglichkeit, die beobachtete Tendenz zur Vorhersage syntagmatischer Assoziationen zu reduzieren, bestünde darin, bei der Auszählung der Kookkurrenzhäufigkeiten die unmittelbare Umgebung eines Stimuluswortes (etwa tex2html_wrap_inline23456 2 Wörter) nicht mehr zu berücksichtigen. Dadurch würde eine Vielzahl durch Kollokationen  bedingter Kookkurrenzen unterdrückt. Beispiele hierfür wären etwa tex2html_wrap_inline23510 und tex2html_wrap_inline23533 . Kapitel gif stellt eine Reihe weiterer Methoden zur Verbesserung der Simulationsergebnisse vor.



Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997