- ...Dissertation
- Dissertation
der Universität Konstanz. Referenten: Prof. Dr. R. Kuhlen (Universität
Konstanz) und Prof. Dr. M. Wettler (Universität-GH Paderborn).
Tag der mündlichen Prüfung: 12.5.1995.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Ordnung
- An anderen Stellen zu findende weitergehende Aussagen,
etwa ``one's ability to produce and recognize grammatical utterances is
not based on notions of statistical approximation and the like''
(Chomsky 1957, S. 16) sollten inzwischen als widerlegt gelten
(vergl. Garside, Leech & Sampson, 1987, sowie Church & Mercer, 1993).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...unvollkommen.
- Armstrong-Warwick (1993) spricht sogar von
``... growing
frustration of trying to use standard rule-based methods to account for
more than a well-chosen fragment of text, regardless of the application.''
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...erforderlich.
- Die Werke der taubblinden
Autorin Helen Keller (1880-1968), die in Cambridge studierte und 1904
``cum laude'' promovierte, zeigen, daß eine Sprache offenbar sogar über
den sensorischen Kanal gelernt werden kann.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...einfallen.
- Dabei ist zu bedenken,
daß der Vorgang des Erlernens von Assoziationen nie abgeschlossen ist,
und daß in einer natürlichen Umgebung stets viele Stimuli vorhanden sind,
deren Variabilität dafür sorgt, daß in verschiedenen Situationen
unterschiedlich assoziiert wird.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...erzielt.
- Als Maßstab für die Güte der Ergebnisse
diente die über alle Stimuluswörter gemittelte Anzahl von
Versuchspersonen, die dasjenige Wort nannten, für das
die höchste Assoziationsstärke zum jeweiligen Stimuluswort
berechnet worden war.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Schwächen
- Beispielsweise wird allen
Wortpaaren, die nicht gemeinsam auftreten, die Assoziationsstärke
Null zugeordnet, obwohl sicherlich auf Grund der Korpushäufigkeiten
der beteiligten Wörter feinere Unterscheidungen möglich wären
(vergl. Kapitel
).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...16#16.
- Die in der Literatur häufig zu findende Unterscheidung zwischen syntagmatischen und paradigmatischen Assoziationen
wird von Wettler (1980, S.11) wie folgt definiert: ``Als syntagmatische Assoziationen
werden Reaktionswörter bezeichnet, die in natürlichen Sätzen
auf die Reizwörter folgen (blue - sky). Diese können durch
Kontiguitätsassoziationen erklärt werden. Die Reaktionswörter
der paradigmatischen Assoziationen gehören der gleichen
Wortklasse an wie die Reizwörter (blue - red).''
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Rundschau
- Diese
Texte wurden vom Druck- und Verlagshaus Frankfurt am Main
in maschinenlesbarer Form zur Verfügung gestellt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Südwestfunks
- Die gedruckten Manuskripte wurden
vom Südwestfunk Baden-Baden bereitgestellt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...zuläßt.
- Es sei jedoch
darauf hingewiesen, daß hier nicht von einer
herkömmlichen lokalistischen Definition von Kurz- und Langzeitgedächtnis
ausgegangen wird, d. h. einer räumlichen Trennung im Gehirn. Stattdessen
wird angenommen, daß der Speicherung im Kurzzeitgedächtnis die den
Neuronen zugeordneten Aktivitäten, der Speicherung im Langzeitgedächtnis
hingegen die Synapsengewichte entsprechen.
In diesem Modell wird gemäß der Hebb'schen Regel (Hebb, 1949) die
synaptische Verbindung zwischen zwei Neuronen während der Dauer ihrer gemeinsamen Aktivierung erhöht. Das Maß der Erhöhung
hängt hierbei von der Höhe der beiden beteiligten Aktivitäten
und der Dauer ab. (Plausibel wäre etwa das Integral aus dem
Produkt der beiden Aktivitäten über die Zeit.) Die in den
Abbildungen
und
gezeigten Kurven
lassen hierbei Rückschlüsse auf ein angenommenes
Abklingen einer Aktivität mit fortschreitender Zeit zu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...vorliegt
- Nur wenn die Wörter i und j
mehrfach im selben Fenster auftreten, kann - abhängig von der
Zählweise - der Fall auftreten, daß die Kookkurrenzhäufigkeit
größer wird als die Korpushäufigkeiten der beteiligten
Wörter.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...übereinstimmen.
- Die Begriffe Head
und Modifier stammen aus der Theorie der Dependenzgrammatik,
die beschreibt, wie die in einem Satz vorkommenden Wörter
voneinander abhängen (vergl. Hays, 1964).
In dem Satz ``er kauft ein neues Fahrrad'' ist neues
ein Modifier von Fahrrad, Fahrrad hingegen
Head von neues. Entsprechend ist kauft Head
von Fahrrad bzw. Fahrrad Modifier von kauft.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...wurde:
- Das Programm wurde von Bernd
Hagen entworfen und implementiert. Die Auswertung wurde
von Gisela Zunker durchgeführt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Kreuzworträtsel
- Rätsel Nr. 41 aus dem
Buch ``Riesige Rätsel mit riesiger Schrift'' (o. J.)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...gemittelt.
- Es wurde also nicht
zunächst innerhalb einzelner Beispiele und anschließend ein zweites
Mal über alle Beispiele gemittelt. Begriffe, die in Problembeschreibung
oder Query mehrfach auftraten, wurden bei der Bestimmung der Mittelwerte
bzw. Mediane wie auch schon bei der Berechnung der Assoziationen
zur Problembeschreibung nur einfach berücksichtigt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...96
- Die Gleichheit beider Werte ist zufällig.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Vokabular
- Da größere Vokabulare das Umgehen mit riesigen
Matrizen erfordern, kann es in der Praxis sinnvoll sein, die
Dimensionalität der betrachteten Matrizen mit Hilfe der sogenannten
Singular Value Decomposition (SVD) zu reduzieren (Ferber, Wettler &
Rapp, im Druck; Schütze, o. J.;
Press et al., 1992, S. 59-70). Dabei bleiben einige der hier
wesentlichen Matrizeneigenschaften erhalten.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Positionierungswörter.
- Der Mittelwert wurde für diese
Anwendung dem Median vorgezogen, da es bei einem Treatment auf
die genaue Wahl jedes einzelnen Wortes ankommt und Ausreißer nicht
toleriert werden sollen. Voraussetzung ist allerdings, daß
Funktionswörter vorab eliminiert werden.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...kann.
- Wertvolle Hinweise zur Darstellung
gab Andreas Eisele von der Universität Karlsruhe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Wörtern
- Hierbei handelt es sich nicht wie
sonst üblich um ein Grundformenwörterbuch. Stattdessen
enthält das Wörterbuch alle Flexionsformen eines
Wortes mit ihren ebenfalls flektierten Übersetzungen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Adjektive
- Diese wurden aus
Grolier's Electronic Encyclopedia nach den Kriterien Korpushäufigkeit und
Eindeutigkeit der Wortklassenzugehörigkeit ausgewählt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Zeitungsartikel
- ``Israel reagiert gegenüber Washington
flexibel''. Frankfurter Allgemeine Zeitung vom 10.6.1991.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...NAME="16478"> -Data-Problem
- In der deutschsprachigen Literatur ist
teilweise auch vom ``Problem knapper Daten'' bzw. vom ``Problem
zu geringer Häufigkeiten'' die Rede.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Worttripel.
- Groß/Kleinschreibung
wurde nicht unterschieden, Satzzeichen wurden wie Wörter behandelt,
mehrfach im Text vorkommende Wortfolgen gehen in die Statistik auch
mehrfach ein.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...werden.
- Anzustreben ist dabei, daß für alle gebildeten
Wortgruppen die Summe der Korpushäufigkeiten der jeweils beteiligten
Wörter einen festzulegenden Mindestwert erreicht. Dies sollte möglich
sein, da es bei
seltenen Wörtern in der Regel viele in gleicher Weise mehrdeutige
Wörter gibt. Bei häufigen Wörtern, bei denen dies oft nicht der
Fall ist, genügen hingegen wenige Wörter zur Bildung einer Gruppe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...wurde.
- Dort werden
beispielsweise bei Zahlwörtern (cardinal numeral: CD) Singular- und
Pluralformen nicht unterschieden, obwohl sich diese
auf die Beugung des folgenden Substantives auswirken.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...sein.
- Beispielsweise
werden einem Substantiv häufig Artikel
vorangehen und Verben folgen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...HREF="node85.html#clustermatrix">
). - Für
450 960 Vektoren mit je
901 920 Positionen wäre ein Speicherbedarf
von etwa 163#163 Einheiten erforderlich. Da die meisten
der Einträge 0 sind, konnte dies platzsparender realisiert werden.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Format.
- Neuere 5 1/4 Zoll MO-Laufwerke haben sogar eine
Kapazität von 2 mal 600 MB.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...NAME="18859"> ,
- Anfragen
per E-Mail an corpora-request64hd.uib.no oder an folgende
Adresse: Humanistik datasenter, Norwegian Computing Centre
for the Humanities, Harald Haarfagres gt. 31, N-5007 Bergen, Norway,
Tel. +47 5 212954/5/6, FAX +47 5 322 656.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Stanford-University.
- Anfragen per E-Mail an
roscheis64csli.stanford.edu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...können.
- Nähere Informationen hierzu
erhält man per E-Mail von cmp-lg64xxx.lanl.gov
unter Eingabe des Wortes help in der Subject-Zeile.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...ist.
- Alternativ kann auch eine Druckfunktion verwendet
werden, wenn Utilities zur Verfügung stehen, die Druckausgaben
in eine Datei umleiten können. Geeignete Umleitungsfunktionen
stellen beispielsweise das Netzwerkbetriebssystem der Firma
Novell (Capture-Befehl)
und die PC-Version des Network-File-Systems (PC-NFS) der Firma Sun
zur Verfügung.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Wortarten).
- Um bei den
Verben nicht zu einem sehr komplizierten
Wortartensystem zu kommen, wurden Verbvalenzen nicht berücksichtigt.
Eine weitere Reduktion der Anzahl der Wortarten bei den Verben
könnte dadurch erreicht werden, daß Tempus und Modus
nicht unterschieden würden. Zur Berücksichtigung feinerer
Verwendungsunterschiede bei den Funktionswörtern mußte eine
große Anzahl von Wortarten gebildet werden. Eine für manche
Anwendungen sinnvolle Vereinfachung könnte dadurch
erreicht werden, daß jedem Funktionswort eine eigene Wortart
zugeordnet würde.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
- Die Grundformen der Adjektive
(z. B. blau, klein, reich) gelten in einem
syntaktisch orientierten Wortartensystem als
Adverbien (Beispiel: ``er ist reich'').
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
- Pronomen (in der 3. Person) sind
Stellvertreter für ein Substantiv oder für ein Substantiv
mit einem vorangestellten Artikel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
- Konjunktionen verbinden Wörter,
Wortgruppen oder Teilsätze. Reiht eine Konjunktion die verbundenen
Satzteile lediglich aneinander und erhält deren formale
Selbständigkeit, so spricht man von einer parataktischen Konjunktion.
Eine hypotaktische Konjunktion bewirkt hingegen eine Unterordnung
von Teilsätzen, d. h. die Bildung von Haupt- und Nebensätzen. Dabei
kann mindestens einer der Teilsätze nicht für sich allein stehen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.