Zuhause bei Michael J. Hußmann

Alle Artificial Life Computer Künstliche Intelligenz Linguistik Mythologie Religion Roboter

Zwei Paradigmen der Sprachverarbeitung (Oktober 1989)

Dieser Aufsatz war Teil der Materialien zu einem Projektseminar „Entwurf eines natürlichsprachlichen Systems“, das ich im Wintersemester 1989/90 am Fachbereich Informatik der Univ. Hamburg veranstaltet hatte. Das Ziel des Projekts war folgendermaßen definiert: „Eine der wichtigsten Aufgaben natürlicher Sprachen besteht in der Initiierung und Steuerung kooperativen Handelns. Sprechhandlungen kommunizieren Intentionen, etablieren gemeinsame, soziale Intentionen mehrerer Agenten und helfen, Rollenzuordnungen bei der Realisierung sozialer Intentionen festzulegen …. Wir wollen diesen Aspekt der Verarbeitung natürlicher Sprachen anhand eines Systems untersuchen, das eine Umwelt simuliert, in der sich einige ebenfalls simulierte Agenten bewegen. Diese Agenten sollen in der Lage sein, ihre Umgebung wahrzunehmen, sie zu verändern und mit den übrigen Agenten zu kommunizieren … Die Agenten sollen nun Aufgaben lösen, die sie nicht alleine, sondern nur in Kooperation mit anderen Agenten bewältigen können; sei es, weil die Aufgabe zu schwer ist …, oder weil sie ihrer Natur nach kooperativ ist ….“

Der Ansatzpunkt für unser Projekt ist insofern ungewöhnlich, als die Konzeption des Systems den Schwerpunkt auf die Behandlung pragmatischer Aspekte legt. Dies entspricht weder dem Mainstream der linguistischen Forschung, noch der typischen Herangehensweise in der sprachorientierten KI. Die Entwicklung natürlichsprachlicher Systeme (NSS) konzentrierte sich bis zum Ende der sechziger Jahre vorwiegend auf syntaktische Phänomene. In den siebziger Jahren fand dann das Problem der semantischen Interpretation stärkere Aufmerksamkeit, und erst ab dem Ende der siebziger Jahre begann sich die sprachorientierte KI mit Problemen der Pragmatik zu beschäftigen. Die klassische Systemarchitektur von NSS, eine Hintereinanderschaltung von Syntax-, Semantik- und Pragmatik-Modulen, reflektiert bis heute diese Entwicklung.

In der Linguistik ist die Bedeutung der Pragmatik für alle anderen Ebenen des Sprachverstehens und der Sprachproduktion lange Zeit unterbewertet worden. Insbesondere im Chomsky-Umfeld wurde die Position vertreten, dass die Analyse der wörtlichen, kontextfreien Bedeutung eines Satzes die primäre Aufgabe einer an semantischen Fragen interessierten Linguistik sei, dass also pragmatische Faktoren erst auf der Grundlage eines solchen Bedeutungsbegriffs analysiert werden sollten (und ohne diese Grundlage auch nicht berücksichtigt werden könnten).

Die wörtliche, kontextfreie Bedeutung einer Äußerung soll sich untersuchen lassen, indem zunächst sämtliche Kontextbestimmungen eliminiert werden. Katz formuliert den Gegenstand eines solchen Forschungsprogramms sehr anschaulich: „… an ideal speaker of a language receives an anonymous letter containing just one sentence of that language, with no clue whatever about the motive, circumstance of transmission, or any other factor relevant to understanding the sentence on the basis of its context of utterance“ (Katz 77). Diese Situation ist aber im tatsächlichen Sprachgebrauch so nie gegeben, weil der Hörer in Abwesenheit von Kontextinformationen normalerweise versucht, den Satz selbst auf Hinweise auf mögliche Kontexte zu untersuchen, die ihrerseits erst der Äußerung Sinn verleihen.

Die Beeinflussung der Interpretation einer Äußerung durch Kontextinformationen wird in diesem Paradigma nicht nur methodologisch als nachgeordnet angesehen (d.h. die Linguistik muss sich zuerst mit der Analyse wörtlicher, kontextfreier Bedeutungen beschäftigen, bevor sie auch Kontextfaktoren in ihre Untersuchung einbeziehen kann), sondern führt auch zu einer bestimmten Sicht der Sprachverarbeitung: es wird angenommen, dass in einem ersten Modul die wörtliche, kontextfreie Bedeutung einer Äußerung erkannt wird, und nur wenn diese Interpretation (z.B. die Interpretation von „Könntest Du mir mal helfen?“ als Frage nach einer Fähigkeit des Hörers) im Kontext nicht akzeptabel ist, ihre tatsächliche Bedeutung dann in einem zweiten Modul ermittelt wird, das auch Kontextfaktoren und übertragene Lesarten berücksichtigt.

Wenn diese Sichtweise korrekt wäre, müsste die Interpretation von kontextfrei interpretierbaren Äußerungen schneller erfolgen als die Interpretation von Äußerungen, deren Bedeutung stark durch Kontextfaktoren determiniert ist. Weiterhin müsste man annehmen, dass Fälle nicht-wörtlichen Sprachgebrauchs wie Metaphern (z.B. „ein Hahn im Korb“, „die Aktienkurse fallen“, „Er ist eiskalt“), Ironie oder indirekte Sprechakte (z.B. „Könntest Du mir mal helfen?“, cf. Searle 75) langsamer verstanden werden. Beide Voraussagen lassen sich jedoch experimentell nicht bestätigen; vielmehr scheint das Gegenteil der Fall zu sein: Die Interpretation indirekter Sprechakte z.B. erfolgt (bei Erwachsenen) schneller als die Interpretation entsprechender wörtlicher Formulierungen (cf. Gibbs 79, Garrod 83, Shatz 78).

In analoger Weise wird bei den möglichen Reaktionen des Hörers auf eine Äußerung zwischen wörtlichen Antworten und kooperativen Reaktionen unterschieden, wobei letztere Präsuppositionsverletzungen korrigieren (beispielsweise präsupponiert „Schlagen Sie immer noch Ihre Frau?“ die Wahrheit von „Sie haben früher Ihre Frau geschlagen.“), die vermutete Absicht des Sprechers berücksichtigen, und diese gegebenenfalls über die wörtliche Antwort hinaus unterstützen. Wiederum suggeriert diese Sichtweise, dass, wenn doch kooperative Reaktionen einen größeren kognitiven Aufwand erfordern, wörtliche Antworten der Normalfall seien, während tatsächlich kooperatives Verhalten nicht nur vorherrscht, sondern auch vom Gesprächspartner erwartet wird. Wörtliche Antworten sind dagegen häufig ein Zeichen absichtlich unkooperativen Verhaltens, das den Gesprächspartner an der Verwirklichung seiner Absichten hindern soll, und somit nicht als primitiv anzusehen (zur Frage, warum Sprecher kooperativ oder unkooperativ sind, cf. Ramm 88).

Eine Grundvoraussetzung des klassischen Paradigmas bildet weiterhin die Annahme, dass so etwas wie die Bedeutung einer Äußerung existiere. In der extremsten Ausformung dieser Hypothese werden „semantische Objekte“ postuliert, die als Bedeutungen von Äußerungen gelten oder diese repräsentieren sollen (cf. Hirst 88, neben vielen anderen) – hierauf basiert das Konzept der Repräsentationssprachen in der sprachorientierten KI. Das zentrale Projekt einer linguistischen Semantik ebenso wie der sprachorientierten KI besteht demnach in der Erforschung der Abbildung von Äußerungen in ihre Bedeutung.

Zumindest im Bereich der Metaphorik hat sich aber bereits gezeigt, dass die Bedeutung einer Äußerung nicht existiert. Die traditionelle Auffassung rekonstruiert Metaphern wie „Max ist ein Gorilla“ nach dem Schema „X ist wie Y hinsichtlich P“, in diesem Fall etwa „Max ist wie ein Gorilla hinsichtlich seiner Gewalttätigkeit“. Das tertium comparationis P wird dabei als eindeutig angenommen. Nach Searle (cf. Searle 79) ist die Interpretation von Metaphern jedoch im allgemeinen Fall „open-ended“, sodass der Hörer immer neue Bedeutungen einer Metapher entdecken kann. Die prinzipiell unbegrenzte Interpretierbarkeit der Metaphern lässt sich auch nicht durch einen Rückgriff auf die vom Sprecher intendierte Bedeutung einschränken, da der Sprecher vielfach gar keine bestimmte Interpretation im Sinn hatte oder andere Interpretationen nicht zurückweisen würde.

Searles Annahme der potentiell unbegrenzten Interpretierbarkeit der Metaphern ist jedoch nur ein Spezialfall des Peirce’schen Konzepts der unbegrenzten Semiose (cf. Peirce 31–58, Eco 72, 85). Auch wenn in der Praxis der Interpretationsprozess irgendwann zu einem vorläufigen Ende kommt, ist dieses Ende doch nicht durch die Äußerung oder die mit ihr verknüpften Absichten des Sprechers determiniert. Zudem kann die Interpretation jederzeit fortgesetzt werden, wenn z.B. ein neuer Aspekt einbezogen werden soll.

Die wichtige Unterscheidung zwischen richtigen und falschen Interpretationen sollte nicht darüber hinweg täuschen, dass Verstehen und Missverstehen gleichermaßen Aspekte menschlicher Kommunikation sind. Die Röhrenmetapher der Kommunikation (vgl. die Diskussion in Maturana/Varela 87:212) suggeriert, es gäbe einen Prozess, der Bedeutungen zwischen Sprecher und Hörer transportiert. Aber einen solchen Prozess gibt es nicht. Kommunikation beinhaltet zwei voneinander unabhängige (wenngleich sich gegenseitig beeinflussende) Handlungstypen: die Äußerungen des Sprechers und die Interpretationshandlungen des Hörers. Missverständnisse entstehen nicht durch Störungen des Bedeutungstransports, vielmehr ist es derselbe Interpretationsprozess, der sowohl (partielles) Verstehen wie auch Missverständnisse produziert.

Wir schlagen nun ein alternatives Paradigma vor, das von einem Primat der Pragmatik ausgeht: Wir betrachten natürliche Sprachen als Instrument der Kommunikation von Beziehungen (cf. Bateson 66) und der Initiierung und Steuerung kooperativer Handlungen (cf. Wittgenstein 84, Werner 88 a,b,c, Werner 89, Grosz/Sidner 88). Die Rolle der Sprache bei der reinen Übermittlung von Informationen über Sachverhalte – und damit wörtlichen Bedeutungen – ist demgegenüber untergeordnet.

Die Sprachverarbeitung lässt sich in diesem Paradigma als zweistufiger Prozess verstehen:

Äußerungen (aber auch andere Handlungen) eines Agenten werden in einem ersten Schritt daraufhin untersucht, welche Schlussfolgerungen über die Absichten, Wünsche, Annahmen und Erwartungen des Agenten sie im gegebenen Kontext zulassen. Der potentiell unbegrenzte Inferenzprozess entspricht dabei der prinzipiell unbegrenzten Interpretierbarkeit der Äußerung.
In einem zweiten Schritt wird dann untersucht, ob und in welcher Weise der Hörer auf die (Sprech-) Handlung des anderen Agenten reagieren soll. Dies hängt im wesentlichen von der Interaktion der Absichten und Wünsche des Hörers mit den (vermuteten) Absichten und Wünschen des Sprechers ab (die gleich, entgegengesetzt, kompatibel oder sich gegenseitig unterstützend sein können), aber auch davon, ob die Äußerung an den Hörer adressiert war (in diesem Fall verlangen die sozialen Normen, dass der Hörer zumindest auf irgendeine Weise reagiert).

Während die Interpretation einer Äußerung im klassischen Paradigma nach dem Schema „X bedeutet Y im Kontext K“ erfolgte, der Kontext also die Interpretation beeinflusste, ist es in unserem alternativen Paradigma gerade umgekehrt: „Die Äußerung X im Kontext K1 erzeugt den Kontext K2“, d.h. die Äußerung modifiziert den Kontext. Die Bedeutung der Äußerung kürzt sich nach diesem Interpretationsschema wunschgemäß heraus, da sie ja im alternativen Paradigma kein zentraler Forschungsgegenstand mehr ist. Auch das praktische Interesse richtet sich ja eher auf die Frage „Was soll die Äußerung“ als auf die Frage nach der Bedeutung.

In dieser Sicht der Sprachverarbeitung ergibt sich kooperatives (oder absichtlich unkooperatives) Verhalten ebenso automatisch wie die Berücksichtigung von Kontextfaktoren und übertragenen Lesarten. Ein weiterer Vorteil liegt darin, dass der skizzierte zweistufige Prozess nicht auf die Verarbeitung von Sprechhandlungen beschränkt ist: Es macht z.B. keinen großen Unterschied, ob ein Agent einem anderen Hilfe anbietet, weil dieser ihn darum gebeten hat, oder weil er dessen Hilfsbedürftigkeit auf andere Weise erkannt hat, da der zweite Verarbeitungsschritt in beiden Fällen der gleiche ist (zu den Unterschieden und Gemeinsamkeiten beider Fälle cf. Eco 85). mjh

Literatur

Bateson 66: Gregory Bateson: Probleme in der Kommunikation von Delphinen und anderen Säugetieren. In: Gregory Bateson: Ökologie des Geistes. Frankfurt am Main: Suhrkamp 1981. 468–485.
Eco 72: Umberto Eco: Einführung in die Semiotik. München: Wilhelm Fink Verlag 1972.
Eco 85: Umberto Eco: Semiotik und Philosophie der Sprache. München: Wilhelm Fink Verlag 1985.
Garrod 83: M. M. Garrod: Young Children’s Responses to Direct and Indirect Directives. In: Journal of Genetic Psychology, Vol. 143, 1983. 217–227.
Gibbs 79: R. W. Gibbs, Jr.: Contextual Effects in Understanding Indirect Requests. In: Discourse Processes, Vol. 2, 1979. 1–10.
Grosz/Sidner 88: Barbara J. Grosz, Candace L. Sidner: Distributed Know-How and Acting: Research On Collaborative Planning.
Hirst 88: Graeme Hirst: Semantic Interpretation and Ambiguity. In: Artificial Intelligence, Vol. 34, 1988. 131–177.
Katz 77: J. J. Katz: Propositional Structure and Illocutionary Force. New York: Crowell 1977.
Maturana/Varela 87: Humberto Maturana, Francisco Varela: Der Baum der Erkenntnis – Die biologischen Wurzeln menschlichen Erkennens. Bern, München, Wien: Scherz 1987. (Originaltitel: „El árbol del conocimiento“, 1984)
Peirce 31–58: Charles Sanders Peirce: Collected Papers. Cambridge, MA: Harvard University Press 1931–58.
Ramm 88: Wiebke Ramm: Sprachliche Kooperativität in Dialogen mit natürlichsprachlichen Systemen. Magisterarbeit, Universität Hamburg 1988.
Searle 75: John R. Searle: Indirect Speech Acts. In: P. Cole, J. L. Morgan (eds.): Syntax and Semantics, Vol. 3: Speech Acts. New York: Academic Press 1975. 59–82.
Searle 79: John R. Searle: Metaphor. In. Andrew Ortony (ed.): Metaphor and Thought. Cambridge: Cambridge University Press 1979. 92–123.
Shatz 78: M. Shatz: Children’s Comprehension of their Mothers’ Question-Directives. In: Journal of Child Language, Vol. 5, 1978. 39–46.
Werner 88a: Eric Werner: Social Intentions. In: Proc. of the ECAI-88, München, August 1988. 719–723.
Werner 88b: Eric Werner: A Formal Computational Semantics and Pragmatics of Speech Acts. In: Proc. of the COLING-88, Budapest, August 1988. 744–749.
Werner 88c: Eric Werner: Socializing Robots: A Theory of Communication and Social Structure for Distributed Artificial Intelligence. In: Les Gasser (ed.): Collected Draft Papers from the 1988 Workshop on DAI. Tech. Report CRI-88-41, Computer Research Institute, University of Southern California, Los Angeles 1988.
Werner 89: Eric Werner: Cooperating Agents: A Unified Theory of Communication and Social Structure. In: M. Huhns, L. Gasser (eds.): Distributed Artificial Intelligence, Vol. 2. Morgan Kaufman and Pitman Publishers 1989.
Wittgenstein 84: Ludwig Wittgenstein: Das Blaue Buch. Eine Philosophische Betrachtung (Das Braune Buch). Frankfurt am Main: Suhrkamp 1984.