next up previous contents index
Next: Evaluierung Up: Kontextorientierte Fehlererkennung und -korrektur Previous: Orthographische Ähnlichkeit zwischen Buchstabenfolgen

Korrekturvorschläge unter Berücksichtigung des Kontextes

Zur Einbeziehung des Kontextes bei der Generierung von Korrekturvorschlägen wurde folgender Algorithmus implementiert: Zunächst wird auf Grund der orthographischen Ähnlichkeit zum fehlerhaften Wort tex2html_wrap_inline25297 eine Liste möglicher Kandidaten gebildet. Diese enthält alle Wörter mit einer orthographischen Ähnlichkeit von S > 5, mindestens aber die zehn Wörter mit der größten Ähnlichkeit. Diese Liste wird anschließend unter Hinzuziehung des Vorgängerwortes tex2html_wrap_inline25301 und des Nachfolgerwortes tex2html_wrap_inline25303 wie folgt in eine Rangfolge gebracht:

  1. Wörter, die sowohl als Nachfolger von W tex2html_wrap_inline25305 als auch als Vorgänger von W tex2html_wrap_inline25307 auftreten.
  2. Wörter, die entweder als Nachfolger von W tex2html_wrap_inline25305 oder als Vorgänger von W tex2html_wrap_inline25307 auftreten.
  3. Wörter, die weder als Nachfolger von W tex2html_wrap_inline25305 noch als Vorgänger von W tex2html_wrap_inline25307 auftreten.

Die Wörter innerhalb der drei Teillisten werden jeweils nach ihrem Ähnlichkeitswert S sortiert. Das Wort mit dem insgesamt niedrigsten Rangplatz ist der vom System favorisierte Korrekturvorschlag.



Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997