next up previous contents index
Next: Textkorpus und Vokabular Up: Versuchsdurchführung Previous: Versuchsdurchführung

Die Recherche-Protokolle

Bei der Simulation von Wortassoziationen wurden die erhaltenen Ergebnisse anhand von Assoziationsnormen überprüft. Eine solche Überprüfung mit empirischem Material wurde von Wettler (Ferber, Wettler & Rapp, im Druck) für die maschinelle Suchwortgenerierung schon früher angeregt. Grundlage hierfür waren die ihm zur Verfügung gestellten 95 Protokolle von Recherchen, die von professionellen Rechercheuren an der Zentralstelle für psychologische Information und Dokumentation in Trier hauptsächlich in den psychologischen Datenbanken PsycINFO und Psyndex durchgeführt worden waren. Den Rechercheuren lagen schriftliche Anfragen von Kunden vor. Diese verwendeten für die Beschreibung ihrer Anfrage ein standardisiertes Formular, auf dem sie einerseits eine ``inhaltliche Beschreibung der Fragestellung'', andererseits ``Suchstichworte möglichst aus der anglo-amerikanischen Fachsprache'' eintragen sollten.

Die Rechercheprotokolle enthalten einerseits den Text dieser Anfragen, die sogenannte Problembeschreibung, andererseits die von den Rechercheuren verwendeten Suchfragen (Queries ) an das Datenbanksystem. Nachfolgend als Beispiel eines der 95 Protokolle:

Inhaltliche Beschreibung der Fragestellung: Auswirkungen der familialen Situation (z.B. unvollständig) auf die
Ablösung des Jugendlichen vom Elternhaus. Adoleszenz. Geschlechts-
spezifische Unterschiede.

Suchstichworte möglichst aus der anglo-amerikanischen Fachsprache:

Adoleszens, Ablösung vom Elternhaus, Familie, Einelternfamilie, geschiedene Familie, Problemfamilien, Geschlechtsunterschiede.

Psyndex:

1   2646  Find All [Family;Parents]/PQ
2   2117  Find All [Family;Parents]/CT
3   1460  Find All Adolescen$/PQ
4   1057  Find All Adolescen$/CT
5    273  Find 1 And 4 Or 2 And 3
6      9  Find 5 And All [Separat$;Individuat$]/PQ
7     16  Find 5 And Identity/PQ
8     34  Find 5 And All [Crisis;Crises;Conflict$]/PQ
9     28  Find 8 And 4
10     9  Find 1 And 4 And Generation Gap/PQ
11     9  Find 1 And 4 And Sex/CT
12    47  Find 6 To 7;9 To 11

Aus jedem der Protokolle wurden zwei Wortlisten erstellt: Die Anfragewortliste, die sämtliche Wörter enthält, die der Kunde in seiner Problembeschreibung verwendet hatte, sowie die Query-Wortliste, die sämtliche vom Rechercheur in der Query verwendeten Wörter, jedoch ohne die Befehle der Abfragesprache, enthält.

Ein Problem wurde durch die in den Queries häufig verwendeten Trunkierungen  aufgeworfen. Dieses wurde dadurch gelöst, daß trunkierte Begriffe in der Weise expandiert wurden, daß alle im verwendeten Vokabular vorkommenden Erweiterungsmöglichkeiten berücksichtigt wurden.



Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997