next up previous contents index
Next: Die Bestimmung korrespondierender Sätze Up: No Title Previous: Zusammenfassung

 

Die maschinelle Generierung von Wörterbüchern  aus zweisprachigen Texten

 

In den vorigen Kapiteln wurde untersucht, wie aus dem gemeinsamen Auftreten von Wörtern in Texten Rückschlüsse auf ihre assoziativen Beziehungen gezogen werden können. Es ist eine interessante Frage, ob sich diese Vorgehensweise auch auf zweisprachig vorliegende Texte übertragen läßt. Es soll also ermittelt werden, welche Wörter eines Ausgangstextes mit welchen Wörtern aus der Übersetzung assoziiert sind. Zu erwarten wäre, daß sich starke Verbindungen insbesondere dann ausbilden, wenn ein Wort des Ausgangstextes häufig mit demselben Wort der Zielsprache übersetzt wurde. Durch Ermittlung dieser starken Assoziationen müßte es also möglich sein, die zur Übersetzung eines Wortes des Ausgangstextes gebrauchten Wörter der Zielsprache zu bestimmen und damit ein Wörterbuch zu erstellen.

Entsprechend den Ausführungen in Kapitel gif ist es zur Berechnung von Kontiguitätsassoziationen  nötig zu definieren, was unter dem ``gemeinsamen Auftreten'' von Wörtern verstanden werden soll. Im einsprachigen Fall wurde vom gemeinsamen Auftreten beispielsweise dann gesprochen, wenn zwei Wörter im selben Satz vorkamen. Übertragen auf den zweisprachigen Fall besteht dann eine Beziehung zwischen zwei verschiedensprachigen Wörtern, wenn sie in einander entsprechenden Sätzen von Ausgangstext und Übersetzung vorkommen.

Diese Definition setzt allerdings voraus, daß die Zuordnung der Sätze zwischen Ausgangstext und Übersetzung nachträglich rekonstruierbar ist. Erfahrungsgemäß bereitet diese Zuordnung einem Sprachkundigen wenig Schwierigkeiten. Um aber auch größere Textmengen bearbeiten zu können, ist ein automatisches Verfahren zur Satzzuordnung  unerläßlich. Hilfreich ist es dabei, wenn der Übersetzungsvorgang im Wesentlichen satzweise vorgenommen wurde. Brown et al. (1991) stellten anhand eines kleinen Auszugs der Protokolle des kanadischen Parlamentes fest, daß ungefähr 90% der englischen Sätze tatsächlich mit nur einem einzigen französischen Satz korrespondieren.





Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997