...Dissertation
Dissertation der Universität Konstanz. Referenten: Prof. Dr. R. Kuhlen (Universität Konstanz) und Prof. Dr. M. Wettler (Universität-GH Paderborn). Tag der mündlichen Prüfung: 12.5.1995.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Ordnung
An anderen Stellen zu findende weitergehende Aussagen, etwa ``one's ability to produce and recognize grammatical utterances is not based on notions of statistical approximation and the like'' (Chomsky 1957, S. 16) sollten inzwischen als widerlegt gelten (vergl. Garside, Leech & Sampson, 1987, sowie Church & Mercer, 1993).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...unvollkommen.
Armstrong-Warwick (1993) spricht sogar von ``... growing frustration of trying to use standard rule-based methods to account for more than a well-chosen fragment of text, regardless of the application.''
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...erforderlich.
Die Werke der taubblinden Autorin Helen Keller  (1880-1968), die in Cambridge studierte und 1904 ``cum laude'' promovierte, zeigen, daß eine Sprache offenbar sogar über den sensorischen Kanal gelernt werden kann.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...einfallen.
Dabei ist zu bedenken, daß der Vorgang des Erlernens von Assoziationen nie abgeschlossen ist, und daß in einer natürlichen Umgebung stets viele Stimuli vorhanden sind, deren Variabilität  dafür sorgt, daß in verschiedenen Situationen unterschiedlich assoziiert wird.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...erzielt.
Als Maßstab für die Güte der Ergebnisse diente die über alle Stimuluswörter gemittelte Anzahl von Versuchspersonen, die dasjenige Wort nannten, für das die höchste Assoziationsstärke zum jeweiligen Stimuluswort berechnet worden war.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Schwächen
Beispielsweise wird allen Wortpaaren, die nicht gemeinsam auftreten, die Assoziationsstärke Null zugeordnet, obwohl sicherlich auf Grund der Korpushäufigkeiten der beteiligten Wörter feinere Unterscheidungen möglich wären (vergl. Kapitel gif).
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...16#16.
Die in der Literatur häufig zu findende Unterscheidung zwischen syntagmatischen und paradigmatischen Assoziationen wird von Wettler (1980, S.11) wie folgt definiert: ``Als syntagmatische Assoziationen werden Reaktionswörter  bezeichnet, die in natürlichen Sätzen auf die Reizwörter  folgen (blue - sky). Diese können durch Kontiguitätsassoziationen erklärt werden. Die Reaktionswörter der paradigmatischen Assoziationen gehören der gleichen Wortklasse  an wie die Reizwörter (blue - red).''
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Rundschau
Diese Texte wurden vom Druck- und Verlagshaus Frankfurt am Main in maschinenlesbarer Form zur Verfügung gestellt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Südwestfunks
Die gedruckten Manuskripte wurden vom Südwestfunk Baden-Baden bereitgestellt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...zuläßt.
Es sei jedoch darauf hingewiesen, daß hier nicht von einer herkömmlichen lokalistischen Definition von Kurz- und Langzeitgedächtnis ausgegangen wird, d. h. einer räumlichen Trennung im Gehirn. Stattdessen wird angenommen, daß der Speicherung im Kurzzeitgedächtnis die den Neuronen zugeordneten Aktivitäten, der Speicherung im Langzeitgedächtnis hingegen die Synapsengewichte entsprechen. In diesem Modell wird gemäß der Hebb'schen Regel  (Hebb, 1949) die synaptische Verbindung zwischen zwei Neuronen während der Dauer ihrer gemeinsamen Aktivierung erhöht. Das Maß der Erhöhung hängt hierbei von der Höhe der beiden beteiligten Aktivitäten und der Dauer ab. (Plausibel wäre etwa das Integral aus dem Produkt der beiden Aktivitäten über die Zeit.) Die in den Abbildungen gif und gif gezeigten Kurven lassen hierbei Rückschlüsse auf ein angenommenes Abklingen einer Aktivität mit fortschreitender Zeit zu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...vorliegt
Nur wenn die Wörter i und j mehrfach im selben Fenster auftreten, kann - abhängig von der Zählweise - der Fall auftreten, daß die Kookkurrenzhäufigkeit größer wird als die Korpushäufigkeiten der beteiligten Wörter.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...übereinstimmen.
Die Begriffe Head und Modifier stammen aus der Theorie der Dependenzgrammatik, die beschreibt, wie die in einem Satz vorkommenden Wörter voneinander abhängen (vergl. Hays, 1964). In dem Satz ``er kauft ein neues Fahrrad'' ist neues ein Modifier von Fahrrad, Fahrrad hingegen Head von neues. Entsprechend ist kauft Head von Fahrrad bzw. Fahrrad Modifier von kauft.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...wurde:
Das Programm wurde von Bernd Hagen entworfen und implementiert. Die Auswertung wurde von Gisela Zunker durchgeführt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Kreuzworträtsel
Rätsel Nr. 41 aus dem Buch ``Riesige Rätsel mit riesiger Schrift'' (o. J.)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...gemittelt.
Es wurde also nicht zunächst innerhalb einzelner Beispiele und anschließend ein zweites Mal über alle Beispiele gemittelt. Begriffe, die in Problembeschreibung oder Query mehrfach auftraten, wurden bei der Bestimmung der Mittelwerte bzw. Mediane wie auch schon bei der Berechnung der Assoziationen zur Problembeschreibung nur einfach berücksichtigt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...96
Die Gleichheit beider Werte ist zufällig.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Vokabular
Da größere Vokabulare das Umgehen mit riesigen Matrizen erfordern, kann es in der Praxis sinnvoll sein, die Dimensionalität der betrachteten Matrizen mit Hilfe der sogenannten Singular Value Decomposition  (SVD) zu reduzieren (Ferber, Wettler & Rapp, im Druck; Schütze, o. J.; Press et al., 1992, S. 59-70). Dabei bleiben einige der hier wesentlichen Matrizeneigenschaften erhalten.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Positionierungswörter.
Der Mittelwert wurde für diese Anwendung dem Median vorgezogen, da es bei einem Treatment auf die genaue Wahl jedes einzelnen Wortes ankommt und Ausreißer nicht toleriert werden sollen. Voraussetzung ist allerdings, daß Funktionswörter vorab eliminiert werden.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...kann.
Wertvolle Hinweise zur Darstellung gab Andreas Eisele von der Universität Karlsruhe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Wörtern
Hierbei handelt es sich nicht wie sonst üblich um ein Grundformenwörterbuch. Stattdessen enthält das Wörterbuch alle Flexionsformen eines Wortes mit ihren ebenfalls flektierten Übersetzungen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Adjektive
Diese wurden aus Grolier's Electronic Encyclopedia nach den Kriterien Korpushäufigkeit und Eindeutigkeit der Wortklassenzugehörigkeit ausgewählt.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Zeitungsartikel
``Israel reagiert gegenüber Washington flexibel''. Frankfurter Allgemeine Zeitung vom 10.6.1991.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...NAME="16478"> -Data-Problem
In der deutschsprachigen Literatur ist teilweise auch vom ``Problem knapper Daten'' bzw. vom ``Problem zu geringer Häufigkeiten'' die Rede.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Worttripel.
Groß/Kleinschreibung wurde nicht unterschieden, Satzzeichen wurden wie Wörter behandelt, mehrfach im Text vorkommende Wortfolgen gehen in die Statistik auch mehrfach ein.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...werden.
Anzustreben ist dabei, daß für alle gebildeten Wortgruppen die Summe der Korpushäufigkeiten der jeweils beteiligten Wörter einen festzulegenden Mindestwert erreicht. Dies sollte möglich sein, da es bei seltenen Wörtern in der Regel viele in gleicher Weise mehrdeutige Wörter gibt. Bei häufigen Wörtern, bei denen dies oft nicht der Fall ist, genügen hingegen wenige Wörter zur Bildung einer Gruppe.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...wurde.
Dort werden beispielsweise bei Zahlwörtern (cardinal numeral: CD) Singular- und Pluralformen nicht unterschieden, obwohl sich diese auf die Beugung des folgenden Substantives auswirken.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...sein.
Beispielsweise werden einem Substantiv häufig Artikel vorangehen und Verben folgen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...HREF="node85.html#clustermatrix">gif).
Für 450 960 Vektoren mit je 901 920 Positionen wäre ein Speicherbedarf von etwa 163#163 Einheiten erforderlich. Da die meisten der Einträge 0 sind, konnte dies platzsparender realisiert werden.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Format.
Neuere 5 1/4 Zoll MO-Laufwerke haben sogar eine Kapazität von 2 mal 600 MB.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...NAME="18859"> ,
Anfragen per E-Mail an corpora-request64hd.uib.no oder an folgende Adresse: Humanistik datasenter, Norwegian Computing Centre for the Humanities, Harald Haarfagres gt. 31, N-5007 Bergen, Norway, Tel. +47 5 212954/5/6, FAX +47 5 322 656.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Stanford-University.
Anfragen per E-Mail an roscheis64csli.stanford.edu.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...können.
Nähere Informationen hierzu erhält man per E-Mail von cmp-lg64xxx.lanl.gov unter Eingabe des Wortes help in der Subject-Zeile.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...ist.
Alternativ kann auch eine Druckfunktion verwendet werden, wenn Utilities zur Verfügung stehen, die Druckausgaben in eine Datei umleiten können. Geeignete Umleitungsfunktionen stellen beispielsweise das Netzwerkbetriebssystem der Firma Novell (Capture-Befehl) und die PC-Version des Network-File-Systems (PC-NFS) der Firma Sun zur Verfügung.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...Wortarten).
Um bei den Verben nicht zu einem sehr komplizierten Wortartensystem zu kommen, wurden Verbvalenzen  nicht berücksichtigt. Eine weitere Reduktion der Anzahl der Wortarten bei den Verben könnte dadurch erreicht werden, daß Tempus und Modus nicht unterschieden würden. Zur Berücksichtigung feinerer Verwendungsunterschiede bei den Funktionswörtern mußte eine große Anzahl von Wortarten gebildet werden. Eine für manche Anwendungen sinnvolle Vereinfachung könnte dadurch erreicht werden, daß jedem Funktionswort eine eigene Wortart zugeordnet würde.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...

Die Grundformen der Adjektive (z. B. blau, klein, reich) gelten in einem syntaktisch orientierten Wortartensystem als Adverbien (Beispiel: ``er ist reich'').
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...

Pronomen (in der 3. Person) sind Stellvertreter für ein Substantiv oder für ein Substantiv mit einem vorangestellten Artikel.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...

Konjunktionen verbinden Wörter, Wortgruppen oder Teilsätze. Reiht eine Konjunktion die verbundenen Satzteile lediglich aneinander und erhält deren formale Selbständigkeit, so spricht man von einer parataktischen Konjunktion. Eine hypotaktische Konjunktion bewirkt hingegen eine Unterordnung von Teilsätzen, d. h. die Bildung von Haupt- und Nebensätzen. Dabei kann mindestens einer der Teilsätze nicht für sich allein stehen.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

Reinhard Rapp
Fri Jul 18 19:19:31 MET DST 1997