Als Ergänzung zum bislang beschriebenen assoziativen Ansatz zur Suchwortgenerierung soll im folgenden ein zweistufiges Modell skizziert werden, mit dem durch Einbeziehung der Prägnanz von Wörtern möglicherweise verbesserte Ergebnisse erreicht werden können. Es wird angenommen, daß es sich bei der Suchwortgenerierung um einen zweistufigen Prozeß handelt: In Phase 1 werden sehr häufige und wenig prägnante Wörter in der Problembeschreibung eliminiert. Danach werden in Phase 2 in der bereits beschriebenen Weise die Assoziationen zu den verbliebenen Wörtern berechnet. Falls erforderlich werden anschließend in einer dritten Phase unter den berechneten Assoziationen wiederum solche mit hoher Korpushäufigkeit und geringer Prägnanz entfernt.
Die Prägnanz
eines Wortes i kann dabei als die Varianz seiner
insgesamt V (Anzahl der Wörter im Vokabular) assoziativen
Verbindungsstärken
definiert werden:
Abbildung: Zusammenhang zwischen Prägnanz P und Korpushäufigkeit H
für die drei Begriffskategorien
(
),
(
) und
(
).
Abbildung
zeigt auf der Basis der 95 Rechercheprotokolle
für die drei Begriffskategorien
,
und
den Zusammenhang zwischen Prägnanz und Korpushäufigkeit. Es ist keine
deutliche Clusterbildung erkennbar. Wie in Tabelle
dargestellt, unterscheiden sich jedoch die über alle 95 Beispiele
gemittelten Werte von Prägnanz und Korpushäufigkeit für die drei
Begriffskategorien deutlich. Obwohl mit den beiden Kriterien
Prägnanz und Korpushäufigkeit also keine eindeutige Trennung
der Begriffskategorien zu erzielen ist, könnten sie dennoch
zu einer Verbesserung der Simulationsergebnisse beitragen.
| | | | |
| Anzahl Begriffe (in 95 Bsp.) | 408 | 354 | 1631 |
| Mittlere Prägnanz | | | |
| Mittlere Korpushäufigkeit | 13145,4 | 8204,1 | 56412,5 |