next up previous contents index
Next: Disambiguierung mehrdeutiger Wörter bei Up: Anwendungen Previous: Anwendungen

Syntaxprüfung

   

Wie schon durch den Vergleich der Familiaritäten für die Referenztexte 1 und 2 angedeutet, werden die in syntaktisch korrekten Texten verwendeten Wortfolgen in der Regel häufiger sein als die in inkorrekten und sich dementsprechend die Familiaritäten unterscheiden. Das System liefert demnach für die syntaktische Korrektheit eines Satzes graduelle Abstufungen und nicht wie viele regelbasierte Syntax-Parser eine binäre richtig/falsch Entscheidung. In Abhängigkeit von der Anwendung kann dies ein Vorteil oder ein Nachteil sein.

Am Beispiel aller 120 in Bezug auf die Wortreihenfolge möglichen Anordnungen der fünf Wörter the, man, is, very und rich soll die Arbeitsweise der statistischen Syntaxprüfung gezeigt werden. Tabelle gif zeigt auszugsweise die nach ihrer Familiarität geordneten Anordnungen. Es zeigt sich, daß die einzige vollständig korrekte Satzbildung, nämlich ``the man is very rich'', den günstigsten Familiaritätswert erhält. Daneben belegen insbesondere solche Anordnungen vordere Ränge, die Fragmente korrekter Sätze sein könnten. Der (bis auf das fehlende Fragezeichen) ebenfalls korrekte Satz ``is the man very rich'' belegt Rang 8.

Tabelle gif zeigt, welche Familiaritäten den Variationen des Satzes ``he/they has/have an/a old/new car'' zugeordnet werden. Der Familiaritätswert ist hier umso besser, je weniger Fehler ein Satz enthält.

 

Nr. Variante M
1 the man is very rich 71.8
2 is the very rich man 75.0
3 very rich man is the 77.8
4 the is very rich man 86.4
5 the very rich man is 109.4
6 is very rich the man 122.4
7 man is the very rich 128.6
8 is the man very rich 139.8
118 rich man very the is 4855.2
119 very man rich the is 5150.8
120 man rich very the is 5170.2
Tabelle: Familiaritäten von 11 der insgesamt 120 möglichen Anordnungen der Wörter the, man, is, very und rich.

 

 

Nr. Variante M Fehler
1 they have an old car 11.2 0
2 he has an old car 17.2 0
3 they have a new car 320.2 0
4 he has a new car 322.0 0
5 he have an old car 575.6 1
6 they have an new car 624.8 1
7 he has an new car 632.8 1
8 they has an old car 724.4 1
9 he have a new car 868.8 1
10 they has a new car 1025.6 1
11 they have a old car 1083.0 1
12 he has a old car 1095.0 1
13 he have an new car 1192.4 2
14 they has an new car 1338.6 2
15 he have a old car 1640.0 2
16 they has a old car 1802.6 2
Tabelle: Zusammenhang zwischen der Familiaritätsfunktion M und der syntaktischen Korrektheit eines Satzes.

 


next up previous contents index
Next: Disambiguierung mehrdeutiger Wörter bei Up: Anwendungen Previous: Anwendungen

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997