next up previous contents index
Next: Versuchsdurchführung Up: No Title Previous: Zusammenfassung

 

Generierung von Suchbegriffen  für die Datenbankabfrage

 

Bei der Suche nach Fachliteratur werden zunehmend bibliographische Datenbanken  verwendet. Bei dieser Art von Informationssystemen wird jede erfaßte Publikation durch eine sogenannte Dokumentationseinheit  repräsentiert. Jede dieser Einheiten besteht aus einer Reihe von standardisierten Felder, die den Autor, den Titel, eine Zusammenfassung, eine Schlagwortliste  und verschiedene bibliographische Angaben enthalten. Für die Suche in solchen Datenbanken sind Retrievalsprachen  entwickelt worden, mit denen sich die für ein gegebenes Suchproblem  relevante Menge von Dokumentationseinheiten eingrenzen und abrufen läßt. Dazu wird das Suchproblem durch eine Anzahl von Wörtern charakterisiert, denen Feldindikatoren  zugeordnet und die durch logische Verknüpfungen verbunden werden (Glöckner-Rist, 1993; Salton & McGill, 1983; Saracevic et al., 1988; van Rijsbergen, 1979).

Das Erlernen und die Verwendung solcher Retrievalsprachen bilden für viele potentielle Endnutzer eine Hürde für die selbständige Suche in Datenbanken. Viele Literaturrecherchen  werden deshalb von speziell dafür ausgebildeten professionellen Informationsvermittlern , den Rechercheuren , durchgeführt. Eine breitere Verwendung von Literaturdatenbanken setzt voraus, daß die derzeit gängigen Retrievalsprachen durch Systeme ergänzt werden, die in der Lage sind, natürlichsprachige Problembeschreibungen in adäquate Suchfragen einer Retrievalsprache zu übersetzen.

Für das am weitesten verbreitete Boole'sche Retrieval  werden zwei Arten von Informationen benötigt. Zum einen muß der Rechercheur entscheiden, welche Wörter aus der Problembeschreibung  und welche zusätzlichen Wörter in die Suchfrage aufgenommen werden sollen. Desweiteren muß er bestimmen, wie die ausgewählten Wörter in der Suchfrage verknüpft werden sollen. Im Rahmen dieser Arbeit soll lediglich der erste dieser beiden Problembereiche behandelt werden. Es soll gezeigt werden, daß es sich bei der Auswahl der Wörter um einen assoziativen Prozeß handelt, der auf die in Kapitel gif beschriebene Generierung von Wortassoziationen zu Mehrfachstimuli zurückgeführt werden kann. Das hier gezeigte Verfahren ist eine Fortentwicklung früherer Arbeiten (vergl. Ferber, 1992; Ferber, Wettler & Rapp, im Druck; Rapp, 1989; Rapp & Wettler, 1990; Wettler & Rapp, 1989; Wettler & Rapp, 1990).

Die Problemstellung sei am Beispiel der folgenden Anfrage erläutert: ``Besteht ein Zusammenhang zwischen Intelligenz und schulischem Erfolg?'' Bei der Formulierung der Suchfrage wäre es sinnvoll, aus der Problembeschreibung die Funktionswörter  und das wenig prägnante Wort ``Zusammenhang'' wegzulassen und dafür den Ausdruck ``schulischer Erfolg'' durch einen synonymen Begriff zu ergänzen. Dieses Vorgehen ist in der folgenden Abfrage realisiert:

FIND intelligence AND ((school AND success) OR grade)

Solche lexikalischen ``Einfälle'' können nicht begründet werden. Ein Rechercheur kann zwar im Nachhinein die Verwendung bestimmter Wörter rechtfertigen. Er kann jedoch nicht angeben, warum ihm ein bestimmtes Wort eingefallen ist und kein anderes. Wie in den vorangehenden Kapiteln behandelt, können solche ``automatischen'' Wortassoziationen auf die Kookkurrenzhäufigkeiten von Wörtern in Texten zurückgeführt werden.




next up previous contents index
Next: Versuchsdurchführung Up: No Title Previous: Zusammenfassung

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997