next up previous contents index
Next: Maschinelle Rechtschreibfehlerkorrektur Up: Anwendungen Previous: Syntaxprüfung

 

Disambiguierung mehrdeutiger Wörter bei der maschinellen Übersetzung 

Bei der maschinellen Übersetzung von Wörtern kommt es zu wesentlich mehr semantischen Ambiguitäten als gemeinhin angenommen wird. Offensichtlich werden durch kontextabhängige Präferenzen bestimmte Interpretationsmöglichkeiten von vorneherein ausgeschlossen. Beispielsweise denkt man bei Präsentation des Satzes ``ich verkaufe meinen Computer'' normalerweise nicht daran, daß meinen auch ``eine Meinung haben'' bedeuten kann.

Mit Hilfe eines kleinen Wörterbuches  im Umfang von etwa 30 000 Wörterngif wurden anhand kurzer Texte die bei der Übersetzung vom Deutschen ins Englische auftretenden Ambiguitäten untersucht. Die Vorgehensweise soll anhand von zwei einfachen Beispielen verdeutlicht werden. Die beiden Sätze ``auf dem Berg steht ein altes Schloß'' sowie ``dem reichen Mann gehört ein teures Auto'' sollen übersetzt werden. Tabelle gif zeigt die dem Wörterbuch entnommenen Übersetzungsmöglichkeiten für die isolierten in den Sätzen enthaltenen Wörter.

 

Wort Übersetzung(en) Wort Übersetzung(en)
auf at, in, on, onto, up, upon dem the
dem the reichen reach, rich, suffice
Berg hill, mountain Mann husband, man
steht is, stands, there is gehört heard, owns
ein a, an, one ein a, an, one
altes old teures costly, expensive
Schloß castle, lock Auto car
Tabelle: Im Wörterbuch nachgeschlagene Wörter für ``auf dem Berg steht ein altes Schloß'' und ``dem reichen Mann gehört ein teures Auto''.

 

Ausgehend von diesen nachgeschlagenen Wörtern lassen sich unter Beibehaltung der Wortreihenfolge für ``auf dem Berg steht ein altes Schloß'' 216, für ``dem reichen Mann gehört ein teures Auto'' 72 Übersetzungsmöglichkeiten konstruieren. Alle diese Übersetzungen wurden generiert und jede Möglichkeit wurde einer Bewertung unterzogen. Die Tabellen gif und gif zeigen auszugsweise die Ergebnisse in sortierter Form. Für ``auf dem Berg steht ein altes Schloß'' erhält tatsächlich die beste Übersetzung, nämlich ``on the mountain there is an old castle'', den günstigsten Familiaritätswert. Weitere ebenfalls korrekte Sätze folgen.

Beim zweiten Beispiel (Tabelle gif) allerdings findet sich die korrekte Übersetzung erst an zweiter Stelle. An erster Stelle steht eine semantisch falsche Übersetzung, die allerdings syntaktisch korrekt ist. Dies ist ein Beispiel dafür, daß sich die durch das System erfaßten Nahbereichsabhängigkeiten in erster Linie für die Herstellung syntaktischer, weniger aber semantischer Korrektheit eignen.

Ein weiteres Problem bei der maschinellen Übersetzung stellt die häufig notwendige Umstellung der Wortreihenfolge dar. Daß sich das System prinzipiell hierfür eignet,

 

Rang Übersetzung M
1 on the mountain there is an old castle 387.5
2 up the mountain there is an old castle 400.8
3 up the hill there is an old castle 421.0
4 in the mountain there is an old castle 424.0
5 at the mountain there is an old castle 443.0
6 upon the mountain there is an old castle 443.9
7 on the mountain is an old castle 452.4
8 onto the mountain there is an old castle 453.8
214 upon the hill stands a old lock 3017.9
215 onto the hill stands a old lock 3030.4
216 at the hill stands a old lock 3096.7
Tabelle: Nach Familiarität sortierte Liste der Übersetzungsmöglichkeiten für ``auf dem Berg steht ein altes Schloß''.

 

 

Rang Übersetzung M
1 the rich man heard an expensive car 1009.7
2 the rich man owns an expensive car 1034.0
3 the rich man owns a costly car 1163.9
4 the rich husband heard an expensive car 1349.0
5 the rich husband owns an expensive car 1374.4
6 the rich husband owns a costly car 1510.7
7 the reach man heard an expensive car 1713.3
8 the reach man owns an expensive car 1736.3
70 the suffice husband owns one costly car 7376.7
71 the suffice man heard a expensive car 7969.9
72 the suffice husband heard a expensive car 8210.6
Tabelle: Nach Familiarität sortierte Liste der Übersetzungsmöglichkeiten für ``dem reichen Mann gehört ein teures Auto''.

 

wurde bereits gezeigt (vergl. Tabelle gif). Noch ungelöst ist das Problem, wenn mehrere unzusammenhängende Wörter in der Quellsprache mit nur einem Wort in der Zielsprache übersetzt werden müssen (z. B. frz. ne ... pas mit not). In diesem Fall ist es schwierig, die entsprechende Übersetzung im Wörterbuch zu finden.


next up previous contents index
Next: Maschinelle Rechtschreibfehlerkorrektur Up: Anwendungen Previous: Syntaxprüfung

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997