Zunächst wurden die Assoziationen zu den 45 unterschiedlichen
Wortpaaren, die sich aus den 10 gewählten Substantiven ohne
Berücksichtigung der Reihenfolge bilden lassen, berechnet,
indem die Assoziationsvektoren der einzelnen Wörter addiert
wurden. Tabelle
zeigt die auf diese
Weise erhaltenen stärksten Assoziationen auf das
Stimuluspaar Sorge Krankheit und vergleicht sie mit
den von den Versuchspersonen gegebenen assoziativen Antworten.
Über alle 45 Beispiele gemittelt ergibt sich folgendes Bild:
Während eine assoziative Antwort
einer Versuchsperson auf ein Wortpaar im Mittel von 3,6% der
übrigen Versuchspersonen ebenfalls genannt wird
(vergl. Tabelle
), geben nur etwa 0,3% der
Versuchspersonen die vorhergesagte assoziative Antwort, also das
Wort auf dem ersten Rangplatz.
Da nur in vier Fällen die vom System vorhergesagte
Antwort überhaupt von irgendeiner Versuchsperson
genannt wird, ist dieser Wert aber statistisch wenig
abgesichert.
| Sorge Krankheit | |||||
| Experiment | Simulation | ||||
| Rang | Wort | Vpn | Rang | Wort | Vpn |
| 26 | Tod | 6 | 1 | Aids | 1 |
| 41 | Angst | 3 | 2 | Virus | 0 |
| 275 | Krankenhaus | 3 | 3 | Immunschwäche | 0 |
| 1607 | Not | 2 | 4 | Patienten | 0 |
| 1 | Aids | 1 | 5 | Lepra | 0 |
| 16 | Arzt | 1 | 6 | Kranken | 0 |
| 1027 | Geld | 1 | 7 | Erreger | 0 |
| 23 | Gesundheit | 1 | 8 | Erkrankung | 0 |
| 19 | Krebs | 1 | 9 | Symptome | 0 |
| 667 | Leid | 1 | 10 | infiziert | 0 |
| 357 | Mutter | 1 | 11 | Krankheiten | 0 |
| 5697 | Pech | 1 | 12 | AIDS | 0 |
| 7463 | Pessimismus | 1 | 13 | Infektion | 0 |
| 410 | Problem | 1 | 14 | Medizin | 0 |
| 1602 | schlecht | 1 | 15 | Malaria | 0 |
| 600655 | schmerzen | 1 | 16 | Arzt | 1 |
| 1829 | tot | 1 | 17 | Diagnose | 0 |
| 5679 | traurig | 1 | 18 | Behandlung | 0 |
| 3285 | Unglück | 1 | 19 | Krebs | 1 |
| 807507 | unheilbar | 1 | 20 | Erkrankten | 0 |
| 3882 | Walter | 1 | 21 | Ausbreitung | 0 |
Eine auf statistischen Schwankungen weniger
empfindliche Methode zur Bewertung der Ergebnisse beruht
auf der Berechnung des Medians der Simulationsrangplätze
aller von den Versuchspersonen genannten assoziativen
Antworten. Von den Versuchspersonen
mehrfach genannte Antworten gehen bei der Medianbildung
mehrfach ein. Für das Beispiel in Tabelle
ergibt sich für die in der linken Spalte aufgeführten
Rangplätze ein Median von 275. Die Bildung des Medians
hat gegenüber einer Mittelwertbildung den Vorteil, daß
sie auf einzelne Ausreißer unempfindlicher reagiert. Im
genannten Beispiel haben etwa die beiden Wörter schmerzen
und unheilbar nur deswegen extrem hohe Rangplätze, weil ihre
Korpushäufigkeit unter 100 liegt und ihnen demnach
gemäß Formel
eine Assoziationsstärke
von 0 zugewiesen wurde.
| Stimuli | Lösung | Matches | Rang | |
| umgangssprachlich | mau | 9138 | 1787 | |
| antiker griechischer Hafen | Aulis | 28589 | 3604 | |
| kurzer heftiger Regenschauer | Guß | 9138 | 1107 | |
| fruchtbare Stellen in der Wüste | Oasen | 28589 | 152 | |
|
dem Wind zugekehrte | Luv | 9138 | 6499 | |
|
germanische Frühlingsgöttin | Ostara | 40901 | 22130 | |
| Schilderung friedlichen Lebens | Idylle | 40901 | 343 | |
|
griechischer Meeresgott | Triton | 40901 | 15417 | |
| Außenseiter im Sport (englisch) | outsider | 56924 | 6124 | |
|
Farbton | rosa | 15561 | 543 | |
| durch, mittels (lateinisch) | per | 9138 | 149 | |
|
germanischer | Ymir | 15561 | 9503 | |
| schwedischer Königsname | Gustav | 40906 | 5 | |
|
Autokennzeichen | UE | 1655 | 813 | |
|
Papstname | Paul | 15561 | 188 | |
| englisch: zu, nach | to | 1655 | 1 | |
|
Himmelsrichtung | Osten | 28589 | 4 | |
|
höherstehend | über | 15561 | 8 | |
|
Staat in Hinterindien | Laos | 15561 | 1 | |
|
Stadt in Oberitalien | Ravenna | 49231 | 4073 |
Als Maß für die Güte der Simulationsergebnisse eignet
sich der Median der Simulationsrangplätze über alle
45 Wortpaare. Dieser hat bei Addition der Assoziationsvektoren
zu einzelnen Stimuluswörtern einen Wert von 1404, bei Multiplikation
hingegen einen Wert von 6255. Diese Werte sind im Vergleich zur
Gesamtzahl der Wörter im Vokabular (978 010) zu betrachten.
Diesem Ergebnis zufolge liefert die Addition der Vektoren
bessere Vorhersagen als die Multiplikation. Diese
Tendenz hat sich auch bestätigt,
wenn Formel
durch Formel
aus Kapitel
ersetzt wurde.
In einem weiteren Experiment wurde untersucht, ob sich das
Lösen von Kreuzworträtseln auf das Assoziieren zu einem
oder mehreren Stimuluswörtern zurückführen läßt und damit
mit dem Assoziationsprogramm simuliert werden kann. Die
in einem Kreuzworträtsel
angegebenen
Stichworte wurden als Stimuluswörter für das Assoziationsprogramm
verwendet. Da der im Kreuzworträtsel verwendete Wortschatz
zu einem großen Teil aus sehr seltenen Wörtern besteht und
dadurch das Problem der geringen Häufigkeiten
gravierend ist, wurde der Algorithmus zur Berechnung
der Assoziationen etwas modifiziert. Verwendet wurde
Formel
, die seltene Wörter
begünstigt. Diese Begünstigung seltener Wörter wurde
jedoch mit Hilfe einer Exponentialfunktion wieder teilweise
neutralisiert. Mit Hilfe schwacher indirekter Assoziationen
konnten die Auswirkungen des Sparse-Data-Problems
reduziert werden (vergl. Kapitel
).
In der sich ergebenden Rangliste der assoziativen Antworten
wurden alle Wörter gelöscht, deren Länge nicht der
Anzahl der im Rätsel vorgegebenen Kästchen entsprach.
Tabelle
zeigt, welche Rangplätze die korrekten
Lösungen auf den vom Simulationsprogramm ausgegebenen Ranglisten
belegten. Die erhaltenen Rangplätze sind relativ zur gesamten
Anzahl von Wörtern der betreffenden Länge zu sehen.
In zwei von 20 Fällen kam das Programm auf die korrekte
Lösung, und in fünf Fällen liegt das Lösungswort
auf einem der vordersten zehn Rangplätze. Schlechte
Vorhersagen finden sich überwiegend dort, wo Stimulus- oder
Lösungsworte sehr niedrige Korpushäufigkeiten aufweisen.
(So hat etwa ``Frühlingsgöttin'' die Korpushäufigkeit 0.)
Sicherlich ließen sich die Resultate erheblich verbessern,
wenn das Korpus um spezielles Textmaterial, etwa Wörterbücher
oder Kreuzworträtsellexika, erweitert würde.