Abstract:
Reading is a highly complex cognitive process. From a neurobiological point of view, it involves at least six linguistic subcompetences including orthographic, semantic, syntactic, phonetic and prosodic competence. Each of these skills is required of the reader to extract different types of information from the text, ranging from the perceptual and the syntactic to the lexical and pragmasemantic one. Based on the main results of cognitiveoriented research on text and reading, this paper illustrates how prosodic competence, combined with formal coherence patterns, can be considered and employed as a reading strategy, enabling the reader to progressively grasp the meanings of a text. In the first part particular attention will be paid to the description of the syntaxprosody interface as well as of its function as a means of encoding of information structure in German. With regard to the teaching of German as a foreign language, the second part of the paper will present a method to train intonational reading. This approach aims to raise foreign language readers’ awareness of prosodic features of written texts and to introduce them to melodic patterns which can be encountered while reading. Such a practical training may prove to be advantageous, as the most typical and apparently “uncorrectable” errors committed by foreign language learners when speaking and reading German texts are almost always related to the domains of phonology and prosody.
Artikel
Die Integration prosodischen und syntaktischen Wissens bei der Ermittlung der Textkohärenz im schriftlichen Textverstehen
Lesen stellt einen hochkomplexen kognitiven Vorgang dar, der sich in mehrere Teilprozesse untergliedern lässt. Unabhängig vom zugrundeliegenden Beschreibungsmodell (cf. Christmann 2015 für eine ausführliche Darstellung) wird beim Leseverstehen generell davon ausgegangen, dass das menschliche Sprachverstehenssystem auf verschiedenen, miteinander interagierenden Ebenen operiert. Die schriftliche Information wird zuerst über die Augen aufgenommen und in den primären visuellen Kortex geleitet, wo sie in ihren basalen orthographischen und phonologischen Eigenschaften verarbeitet wird. Allein dieser erste Verarbeitungsschritt, bei dem das Lesen ansetzt, vereint verschiedenste Prozesse, die an der Identifikation von Buchstaben und Wörtern beteiligt sind: Dazu gehören Gedächtnis, Wahrnehmungs, Artikulationsund sonstige Prozesse. Da Buchstaben und Wörter üblicherweise nicht isoliert gelesen, sondern in einem größeren sinnvollen Satzund Textzusammenhang aufeinander gezogen werden, werden sie in einem späteren Zeitpunkt, bei der sogenannten postlexikalischen Verarbeitungsphase, auf der Grundlage interner semantischer Relationen zu Bedeutungseinheiten integriert und in Phrasen segmentiert, denen eine bestimmte syntaktische Funktion zugewiesen wird. Von allen suprasegmentalen Phänomenen wie Betonung, Phrasierung, Intonation wird in diesem Vorgang offensichtlich abgesehen und die Zuweisung einer prosodischen Struktur in keinerlei Weise berücksichtigt. Wie wir aber zwischenzeitlich wissen, ist auch die Prosodie im schriftlichen Textverstehen involviert.
Bereits Ende der 1980er Jahre gelang Silverman (1987) am Beispiel des Englischen der Nachweis, dass die Schriftlichkeit bestimmte prosodische Normierungen aufweist, die dem Leser den Weg zum Textverstehen ebnen und den Rezeptionsvorgang erheblich beeinflussen können. Silverman machte in seiner Analyse deutlich, dass die Skalierung von Tonakzenten sowie die Dauerverhältnisse zwischen Sätzen eine disambiguierende Funktion erfüllen und wesentlich beitragen können, die richtigen Bezüge zwischen referentiellen Textelementen zu verstehen. Trotz dieser wichtigen Evidenz, deren Ertrag auch in späteren wissenschaftlichen Arbeiten bestätigt wurde (cf. z. B. Bader 1996: 20), ist dieser Aspekt bisher kaum untersucht und in der muttersowie in der fremdsprachlichen Lesedidaktik weder beschrieben noch experimentell erprobt worden.
Im vorliegenden Aufsatz soll der Beitrag der Prosodie als kohärenzstiftendes Mittel im schriftlichen Textverstehen thematisiert werden. Dabei wird in einem ersten Schritt auf die Art und Position von Akzenten und Tönen als Kodierungsmittel der Informationsstruktur im Deutschen eingegangen und der Beitrag der Schnittstelle Syntax Prosodie zur Äußerungsbedeutung erfasst. Anschließend wird im zweiten Teil ein Analyseverfahren zur Einübung einer Soll Intonation präsentiert, das insbesondere für die fremdsprachliche Lesedidaktik fruchtbar gemacht werden kann. Dieses Instrumentarium zielt darauf hin, das prosodische Sprachbewusstsein von Lesenden zu fördern und melodische Muster zu präsentieren, an die DaF Lernende beim Lesen herangeführt werden können. Gerade für den Fremdsprachenunterricht ist eine Einübung dieser Art insofern von Vorteil, als die typischen Fehler, die Nicht Muttersprachler beim Sprechen und Vorlesen deutscher Texte begehen und die eine starke „Verbesserungsresistenz“ aufweisen, insbesondere dem Teilbereich der Prosodie zuzuordnen sind (cf. Cosentino 2019; Hirschfeld 1994, 2019; Missaglia 1999, 2012).
Die lautsprachliche Verankerung der menschlichen Sprachfähigkeit scheint derart stark zu sein, dass wir beim Lesen den Eindruck haben, das Gelesene auch zu hören. Das Umgekehrte gilt allerdings nicht: Wenn wir einen sprachlichen Ausdruck hören, haben wir nicht den Eindruck, ihn auch zu sehen. Diese Asymmetrie zwischen dem Verstehen geschriebener und dem Verstehen gesprochener Sprache belegt eindrucksvoll die Abhängigkeit der ersteren von der letzteren. Zwar wird schriftliche Sprache nicht unbedingt phonetisch realisiert, sie enthält aber zahlreiche Hinweise auf informationsstrukturelle Kategorien sowie auf syntaktische Prozesse, die typischerweise mit prosodischen Konfigurationen einhergehen. Allerdings sind schriftliche Texte hinsichtlich ihrer prosodischen Struktur unterspezifiziert. Wenn Hörer beim mündlichen Textverstehen die intonatorische Kontur schon mitgeliefert bekommen, müssen Leser den fehlenden akustischen Input selbst kompensieren und auf Grundlage des orthographischen Inputs eineinterne auditive Repräsentation erzeugen, die mit darüber entscheidet, wie der Text zu interpretieren ist (cf. Blühdorn 2012: 146f.; Cosentino 2015: 329f.).
Die Frage nach der Funktion der lautsprachlichen Ebene im Sprachverarbeitungsprozess ist insbesondere im Zusammenhang mit Forschungen zum Kurzzeitgedächtnis gestellt worden. Hierzu hat die größte Aufmerksamkeit vor allem die Frage erhalten, welche Rolle phonologische Repräsentationen im Bereich der Worterkennung spielen. Beispielsweise vertraten in den 1970er und 1980er Jahren einige Arbeitsgedächtnismodelle (cf. Baddeley/Hitch 1974) die Meinung, unser Gedächtnissystem sei phonologisch basiert und die phonologische Reanalyse ein maßgeblicher Faktor zum Textverständnis. Diesem Modell zufolge ist eine Komponente des Arbeitsgedächtnisses, die so genannte „phonologische Schleife“ (phonological loop), dafür zuständig, die sprachlichen Informationen in einer phonetischen Form abzulegen. Diese Annahme wurde auch anhand neurobiologischer Studien (cf. Wittmann/Pöppel 2013: 227f.) und psycholinguistischer Leseexperimente (cf. Bader 1998: 2) bestätigt, welche den Einfluss der Leseprosodie auf die syntaktische Verarbeitung nachweisen konnten. Etwas später gelang außerdem eye tracking Studien (cf. Ashby/Clifton 2005) durch die Beobachtung der Augenbewegungen der Nachweis, dass auch beim stillen Lesen eine prosodische Kontur aufgebaut wird, die den Leseprozess steuert und das Textverstehen beeinflusst. Dabei greift der „lesende Parser“1 (cf. Bader 1996: 225) auf einen phonologischen Prozess (phonological coding) zurück, der geschriebene Sprache mit phonologischen Repräsentationen koppelt und den Mangel an Prosodie kompensiert. Den dabei ablaufenden Prozess bezeichnet Féry (2006: 164f.) als „leise Prosodie“ (cf. auch Slowiaczek/Clifton 1980). Darunter wird das innere Sprechen verstanden, ein Phänomen, das aus dem Lesen nicht nur einen rein visuellen Vorgang, sondern auch einen phonologisch gesteuerten Prozess macht, der manchmal auch von der Aktivität der Artikulationsorgane begleitet wird.
Betrachtet man verschiedene Theorien und linguistische Arbeiten, die sich mit der Ableitung der prosodischen Struktur befassen (cf. Korth 2014: 41f. für einen Überblick), so findet man eine ganz Reihe möglicher Faktoren, denen ein Einfluss auf die Prosodie zugesprochen wird: syntaktische, informationsstrukturelle, semantische, koprosodische, metalinguistische und empathische Faktoren. Die syntaktischen Faktoren nehmen dabei in den meisten Theorien eine zentrale Stellung ein.
Über das Verhältnis zwischen Prosodie und Syntax sind zahlreiche Auffassungen vertreten worden. Es wird einerseits eine mehr als zufällige Übereinstimmung zwischen prosodischen und morphosyntaktischen Strukturen beobachtet, doch wird andererseits auch immer wieder darauf hingewiesen, dass prosodische und syntaktische Strukturen keineswegs zusammengehören müssen. In der Strukturellen Linguistik z. B. wird Grammatik als ein System mit mehreren voneinander unabhängigen Ebenen angesehen. In seiner Theorie der „Arbitrarität des Sprachzeichens“ z. B. fokussiert Saussure (1916) seine Diskussion primär auf das unabhängige Verhältnis zwischen ‚Lautbild‘ (image acoustique) und ‚Vorstellung‘ (concept) und belegt die Willkürlichkeit dieser Zuordnung mit der Tatsache, dass dasselbe Objekt der Realität von Sprache zu Sprache verschieden benannt wird. So sind nach Saussure die Lautgestalt von Worten, ihre grammatischen Kategorien sowie die Fähigkeit, sich syntaktisch mit anderen Sprachelementen zu kombinieren, prinzipiell voneinander unabhängig. In der Generativen Linguistik hingegen spielt die Annahme, dass die Prosodie satzbezogen sei und als Teil der Syntax durch syntaktische Konstruktionen bestimmt werde, eine sehr wichtige Rolle. Es scheint somit zum einen eine Reihe von Autoren (z. B. Chomsky/Halle 1968) zu geben, die davon ausgehen, dass die prosodische Struktur aus der syntaktischen Struktur durch ein Abbildungsmechanismus erzeugt wird; zum anderen betrachten andere Autoren (z. B. Bolinger 1972; Selting 1995) die Prosodie als autonomes Signalisierungssystem, das von der Syntax unabhängig ist und getrennt von ihr untersucht werden muss.
Die syntaktische Struktur einer Äußerung dürfte in mindestens drei Bereichen für die prosodische Gestaltung schriftlicher Texte relevant sein (cf. hierzu Duden 2016: 100):
die Ermittlung von Äußerungsakzenten
die Phrasierung
die Zuweisung der Intonationskontur
Sie legt jedoch in keinem dieser Bereiche die phonologischen Eigenschaften vollständig fest: Teils besteht nur ein indirekter Zusammenhang, teils schränkt die syntaktische Struktur die prosodischen Gestaltungsmöglichkeiten lediglich ein.
Im Deutschen zählen prosodische Merkmale neben der Konstituentenabfolge zu den Hauptkodierungsmitteln der Informationsstruktur (cf. Musan 2010). Informationsstrukturelle Kategorien lassen sich durch bestimmte Tonhöhenbewegungen kodieren und können somit voneinander unterschieden werden. Das spielt im Rezeptionsprozess für die Interpretation von einzelnen Informationsschritten, i. e. von kommunikativ abgeschlossenen Einheiten eine wesentliche Rolle. Ein einfaches Beispiel:2
(1) {Was hast du im Einkaufszentrum gekauft?} im /SUpermarkt habe ich [karTOF\feln]F gekauft.
In (1) markiert die doppelte Unterstreichung den Fokus (F), i. e. den Satzteil, der die defizitäre Information (Was?) ergänzt und die Informationserwartung erfüllt (Kartoffeln); dies wird durch einen fallenden Akzent (\) kodiert. Die einfache Unterstreichung markiert das Topik (T) (Büring 1997). Topiks befinden sich im Eröffnungsteil einer Intonationsphrase (von hier an: IP3), im sogenannten pränuklearen Hintergrund. Ihre kommunikative Funktion besteht darin, die Gültigkeit des Fokus und die Erwartung des Adressaten in Bezug auf den Informationsbeitrag der IP auf einen bestimmten Sachverhalt einzuengen – hier beispielsweise auf einen bestimmten Laden des Einkaufszentrums, nämlich den Supermarkt. Sie werden durch steigende Akzente (/) hervorgehoben.
Zur Ermittlung des Fokusakzents geht man generell davon aus, dass alle Sprachen eine DefaultProsodie aufweisen, die ein regelmäßiges, nicht immer völlig isomorphes Mapping zwischen prosodischer und syntaktischer Struktur zulässt (cf. Selkirk 1980: 2). Beispielsweise formuliert die Generative Grammatik (cf. Chomsky/Halle 1968: 25) eine grundlegende phonologische Regel, die auf der syntaktischen Oberflächenstruktur operiert: die Nuclear Stress Rule (NSR). Die Regel besagt, dass die Fokusakzentzuweisung völlig automatisch passiert, sobald die syntaktische Struktur des Satzes feststeht. Demzufolge wird der Fokusakzent der am weitesten rechtsstehenden lexikalischen Einheit der Fokusdomäne (major class word) zugeordnet:
In den 70er Jahren versuchte man, diese generative Perspektive zur Akzentzuweisung auch auf das Deutsche zu übertragen (cf. hierzu Féry/Herbst 2004: 44). Dabei wurde aber klar, dass NSR nicht immer zu richtigen Vorhersagen führt und dass Deutsch und Englisch – trotz mancher Ähnlichkeit – bei der Akzentplatzierung unterschiedliche Kriterien heranziehen müssen. Ein wesentlicher Schwachpunkt für die Anwendung der NSR auf den deutschen Satz besteht z. B. darin, dass sie semantische Kategorien ausschließt und nur die oberflächliche Linearstruktur der syntaktischen Konstituenten berücksichtigt:
Wie die Beispiele zeigen, ist das von NSR postulierte Prinzip nur für Äußerungen gültig, bei denen die am weitesten rechtsstehende lexikalische Kategorie mit dem postverbalen Objekt zusammenfällt. Dass dies vor allem das Englische betrifft, liegt darin begründet, dass im Englischen satzfinale Argumente häufiger vorkommen als im Deutschen, wo die satzfinale Position meist vom Nachverb besetzt wird. Würde man die NSR ohne Weiteres auch auf das Deutsche übertragen, dann müsste man annehmen, die meisten Äußerung des Deutschen wären verbbetont. Das ist offensichtlich nicht der Fall. Zu den elaboriertesten Theorien der Beschreibung konstituenteninterner Akzentstruktur ist außerdem Cinques (1993) Null Theory of Phrase Stress (NPS) zu rechnen. Cinque geht davon aus, dass in allen Sprachen der Kopf einer syntaktischen Phrase in der prosodischen Repräsentation prominenter realisiert wird als die übrigen Konstituenten im Syntagma. Außerdem, wenn einer komplexen Konstituente ein Fokusmerkmal zugewiesen wird – also F markiert ist –, dann fällt der Akzent auf den Kopf der syntaktisch zutiefst eingebetteten Phrase, wobei die syntaktische Einbettungstiefe der Anzahl der Projektionsebene oberhalb des betreffenden Wortes entspricht.
Abbildung 1 verdeutlicht dieses Prinzip in vereinfachter Darstellung für einen Satz:
Für den deutschen Satz sagt Cinques Theorie voraus, dass der Fokusakzent auf das Verb bzw. den infiniten Verbteil (den Kopf der VP) fällt. Dies ist jedoch nur in Sätzen zu beobachten, die außer dem Subjekt keine weitere Verbergänzung enthalten – wie unten in (4) und (5). Sobald eine Verbergänzung vorhanden ist, gilt diese und nicht mehr das Verb als tiefste eingebettete Konstituente und der Fokusakzent fällt auf das Mittelfeld (6). Allgemein gilt deshalb, dass das verbnächste Satzglied den Fokusakzent auf sich zieht. Entsprechendes gilt für Nominalphrasen: Sobald ein postnominales Attribut vorhanden ist, fällt der Fokusakzent auf dieses und nicht mehr auf den nominalen Kopf, i. e. er tendiert immer nach rechts (7):
(4) peter [TRINKT\]F.
(5) peter muss [TRIN\ken]F.
(6) peter trinkt [ein BIER\]F.
(7) peter trinkt ein bier [aus der FLA\sche]F.
Auch andere Faktoren können die Zuweisung von Fokusakzenten und die Aufteilung von informationsstrukturellen Kategorien steuern. Unter Berücksichtigung von Kategorien wie Kasus und (Un)Definiertheit regelt z. B. die Morphosyntax die Reihenfolge der Konstituenten und bestimmt ihre Einbettungstiefe, wonach dann die prosodische Struktur festgelegt wird. Mit Bezug auf ditransitive Satzkonstruktionen fasst Büring (1997: 13) in Anlehnung an Lernerz (1977) diese Faktoren wie folgt zusammen:
Definite NPs precede indefinite NPs
Non focused NPs precede focused NPs
Dative NPs precede accusative NPs
Diese drei Bedingungen können auf verschiedene Art und Weise miteinander interagieren: Solange die dritte Bedingung stimmt, können entweder die erste oder die zweite verletzt werden; umgekehrt kann die letzte nur dann verletzt werden, wenn die beiden ersten Bedingungen stimmen. Mit anderen Worten: Wenn das Dativobjekt dem Akkusativobjekt vorangeht, dann ist jede Fokusund Definitheitsverteilung zwischen den Objekten möglich:
(8) angela merkel hat [einer raffinierten pannaCOT\ta]F den früchteteller vorgezogen.
(9) angela merkel hat einer raffinierten pannacotta [den FRÜCH\teteller]F vorgezogen.
Das Akkusativobjekt kann aber dem Dativobjekt nur dann vorangehen, wenn das Dativobjekt F markiert und das Akkusativobjekt definit ist:
(10) angela merkel hat den früchteteller [einer raffinierten pannaCOT\ta]F vorgezogen.
Eine F-Markierung des vorangestellten direkten Objekts wie in (11) würde die Akzeptabilität und die Grammatikalität des Satzes erheblich gefährden:
(11) *angela merkel hat [den FRÜCH\teteller]F einer raffinierten pannacotta vorgezogen.
Außerdem spielt bei der Fokuszuweisung auch die Verbeigenschaft eine entscheidende Rolle. Betrachte man z. B. Sätze mit intransitiven ergativen und unergativen Verben. Ergative (oder unakkusative) Verben (entstehen, auffallen, gelingen etc.), bei denen das Subjekt sich wie das Akkusativkomplement transitiver Verben verhält, bekommen im Regelfall einen Hauptakzent auf dem Subjekt. Aus diesem Grund werden sie auch als Thema Verben bezeichnet:
(12) [das KIND\]F ist geboren.
Wie auch empirische Studien belegen (cf. Dimroth et al. 2010; Turco/Dimroth/Braun 2013), kann im Deutschen die Akzentuierung des finiten Verbs in bestimmten Kontexten die temporale oder modale Komponente des Finitums fokussieren und somit den Wahrheitswert der kodierten Proposition hervorheben. In diesem Fall spricht man von F VERUM Fokus (cf. Höhle 1991). Darunter versteht man einen „semantischen Fokus“, der „dem Verb ein Bedeutungselement VERUM zu[ge]ordnet, so daß dieses Element durch die Betonung des Verbs hervorgehoben wird“ (Höhle 1991: 114). Nach dieser Definition ist VERUM also nicht nur ein Wahrheitsprädi kat, sondern auch ein Illokutionstyp Operator:
(13) {Peter war gestern nicht zu Hause} doch, peter [WAR\]F \]F zu hause (Tempus Fokus)
(14) {Ich wünsche, du wärst mein Freund} aber ich [BIN\]F dein freund. (Modus Fokus)
Wie die Beispiele nahelegen, kommt VERUM Fokus dann vor, wenn der gesamte Satz bereits gegeben ist und der Zweck der Äußerung nunmehr darin besteht, seinen Wahrheitsgehalt zu bestätigen. Dass allein die Verbformen betont ist, das soll offensichtlich nicht heißen, dass ihr lexikalischer Inhalt oder ein Inhaltsbestandteil der Flexionsform hervorgehoben wird. Was man in (13) und (14) intuitiv als hervorgehoben versteht, ist vielmehr die Bekundung, dass der Spre cher den zugrundeliegenden Gedanken für wahr hält (cf. Höhle 1991: 112). Mit anderen Wor ten: Gegeben ist nur der „Satzradikal“ ohne den „Satzmodusindikator“ (Büring 2006: 152). So kann man den Effekt, den die Betonung des Verbs in (13) und (14) hat, einigermaßen plausibel umschreiben, indem man das Prädikat WAHR einführt und als inhaltlich hervorgehoben betrachtet:
(13a) ES IST WAHR/ES TRIFFT ZU, dass Peter gestern zu Hause war.
(14a) ES IST WAHR/ES TRIFFT ZU, dass ich dein bester Freund bin.
Höhle (1991: 123f.) hat außerdem beobachtet, dass dieser VERUM Effekt auf Verben in Zweitstellung beschränkt ist. Bei Nebensätzen hätte eine entsprechende Form in Endstellung nicht denselben Effekt. Sie würde keinen VERUM Effekt bewerkstelligen, sondern bloß zu einer Tempus Fokussierung dienen. Für die Bestätigung des Wahrheitsgehalts sei in Nebensätzen die übliche Satzbetonung entscheidend. Demnach können Beispiele (15) und (16).
(15) liliane meint, dass heinrich [eine TOR\te]F bäckt.
(16) liliane meint, dass heinrich eine torte [BÄCKT\]F.
folgendermaßen paraphrasiert werden:
(15a) Ja, es ist wahr, dass Heinrich eine Torte bäckt.
(16a) Ja, Heinrich bäckt gerade/bald/irgendwann eine Torte.
Immer in Bezug auf Nebensätze merkt Höhle (1991: 130) zudem an, dass bei daßund obSätzen das Inhaltsbestandteil VERUM auch den Subjunktoren zugeordnet werden kann (17). Allerdings betont der Autor, dass diese Fokussierung zwar möglich ist, aber mit einem mehr oder weniger starken Fortsetzungsbedürfnis einhergeht, dessen Bedingungen noch nicht vollständig geklärt sind:
(17) {Weißt du, ob Anna kürzlich in Rom war?} ich bin sicher, [DASS\]F sie in rom war (… aber ich weiß nicht wann).
Der Gegenpol zu VERUM Fokus Sätzen stellen die sogenannten All New oder Ganzfokus Sätze (cf. Wunderlich 1988: 15), in denen alle Bestandteile des Diskurses im Moment der Äußerung neu eingeführt werden. Sie werden normalerweise als Beginn einer neuen Diskurseinheit realisiert und antworten auf die allgemeinen Fragen Was ist los? Was ist passiert?. Dabei fällt der Fokusakzent auf die am tiefsten eingebettete Verbkonstituente, aber die Fokusdomäne projiziert auf die ganze Intonationsphrase hinaus.
(18) {Was ist los?} [angela merkel hat zehn KI\lo verloren]F.
Im Vergleich dazu werden Sätze, die zwar ein Ereignis in seiner Gesamtheit darstellen, aber dabei einen größeren zugrundeliegenden Zusammenhang erklären, als eventiv (oder thetisch) klassifiziert und bekommen typischerweise einen Fokusakzent auf dem Subjekt (cf. Féry 1993: 43f.). Betrachte mal folgendes Beispielpaar:
(19) mein /AUto ist [ka/PUTT geGANG\en]F.
(20) [mein /AUto\]F ist kaputt gegangen.
Im Gegensatz zum Satz in (19), der eine klassische kategorische Topik Fokus Struktur aufweist, besitzt eine eventive Aussage wie in (20) kein Topik. Sie drückt lediglich das Stattfinden eines Ereignisses oder das Bestehen eines Zustands aus (ibd.). So gibt (20) eine Erklärung für ein Verhalten (z. B. eine Verspätung oder das Versäumen eines Termins) und bekommt in dieser Lesart einen einzigen Tonakzent auf Auto. Es geht dabei also nicht um eine Aussage über das kaputtgegangene Auto wie in (19), vielmehr wird die Panne des Autos als Erklärung für ein damit verbundenes zweites Ereignis – z. B. den Grund des Verspätens – aufgefasst.
Ein weiteres Beispiel für eine Konstituentenklasse, die sich durch Akzentdaten differenzieren lässt, sind Koprädikative. Bei diesen Konstruktionen folgt die Fokusmarkierung zwei Prinzipien, je nachdem, ob es sich dabei um Resultatsprädikative oder um Umstandsprädikative (auch depiktive Attribute) handelt. Erstere drücken einen Umstand des Subjekts und des Objekts aus, der durch das Verb selbst herbeigeführt wird; letztere dagegen drücken einen Zustand des Subjekts oder des Objekts aus und bezeichnen einen zeitgleich zur Handlung vorliegenden Umstand, der aber davon wesentlich unabhängig ist (cf. ibd.: 35f.). Mit anderen Worten: Resultatsprädikative verhalten sich eher wie Argumente des Verbes, fügen der Verbalhandlung einen Resultatszustand hinzu und werden meist im Verb aufgenommen, i. e. sie verlieren ihren Status als unabhängige Phrasen; in diesem Fall fällt der Fokusakzent auf die interne Konsti tuente (21). Bei Umstandsprädikativen ist die semantische Verknüpfung mit dem Verb nicht so eng, sie sind eher als Attribute aufzufassen und bekommen selbst den Fokusakzent (22):
(21) ich habe [die FLA\sche]F leergerunken (Resultativprädikativ)
(22) sie hat das Steak [ROH\]F gegessen. (Umstandsprädikativ)
Die hier diskutierten Regeln zur Fokuszuweisung bestimmen die Lage des Fokus, allerdings nicht die Ausdehnung der fokussierten Konstituente. Wie in (18) bereits angedeutet, betrifft die Hervorhebung meist nicht nur den Fokusexponenten, sondern sie kann Einheiten unterschiedlicher Größe erfassen: eine Silbe, ein Wort, eine Wortgruppe bis hin zur ganzen Äußerung. So kann man z. B. mit der Zeichenkette in (23) bei identischer Akzentuierung mindestens acht unterschiedliche Fragen beantworten. Diesen Vorgang bezeichnet man als Fokusprojektion (cf. Uhmann 1991):
(23) ich habe gehört, dass angela merkel beim mittagessen einen FRÜCH\teteller bestellt hat.
(23a) {Was für einen Teller hat Angela Merkel beim Mittagessen bestellt?} ich habe gehört, dass angela merkel beim mittagsessen einen [FRÜCH\te]F teller bestellt hat – und nicht einen KÄ\se(teller).
(23b) {Was hat Angela Merkel beim Mittagessen bestellt?} ich habe gehört, dass angela merkel beim mittagsessen [einen FRÜCH\teteller]F bestellt hat – und nicht einen OBST\salat.
(23c) {Was hat Angela Merkel beim Mittagessen gemacht?} ich habe gehört, dass angela merkel beim mittagsessen [einen FRÜCH\teteller bestellt]F – und nicht eine CO\la getrunken – hat.
(23d) {Was hat Angela Merkel gemacht? } ich habe gehört, dass angela merkel [beim mittagessen einen FRÜCH\teteller bestellt]F – und nicht beim frühstück eine KÄ\sebretzel gekauft – hat.
(23e) {Was ist mit Angela Merkel passiert?} ich habe gehört, dass angela merkel [beim mittagessen einen FRÜCHteteller bestellt hat]F – und nicht letztes jahr beim SKI\fahren gestürzt ist.
(23f) {Was hast du gehört?} ich habe gehört, [dass angela merkel beim mittagessen einen FRÜCH\teteller bestellt hat]F – und nicht dass die katze meiner nachbarin vorgestern im TEICH\ ertrunken ist.
(23g) {Was hast du?} ich habe [gehört, dass angela merkel beim mittagessen einen FRÜCH\teteller bestellt hat]F – und nicht gesehen, dass der mann gestern abend eine BANK\ überfallen hat.
(23h) {Was ist mit dir los?} ich [habe gehört, dass angela merkel beim mittagessen einen FRÜCH\teteller bestellt hat]F – und nicht bin gefragt worden, ob sie das DARF\.
(23i) {Was ist passiert?} [ich habe gehört, dass angela merkel beim mittagessen einen FRÜCH\teteller bestellt hat]F – und nicht sie ist davon ausgegangen, dass die simon dach straße geFÄHR\lich geworden ist.
Die Beispiele zeigen, dass durch den Fokusakzent – wenn er auf die am tiefsten eingebettete Konstituente gelegt wird – nicht eindeutig definiert ist, welche Konstituente faktisch als Fokus verstanden werden soll. Bei gleich realisierter Akzentuierung können unterschiedliche Satzteile fokussiert sein: Ein (Teil)Wort wie in (23a), ein Satzglied wie in (23b), eine Verberweiterung wie in (23c), eine Verbalphrase wie in (23d), eine Flexionsphrase wie in (23e), ein Nebensatz wie in (23f) und so weiter bis hin zu einem vollständigen, ggf. sogar komplexen Satz wie (23i). In allen genannten Fällen ist Früchder Fokusexponent, wie an der Großschreibung der Akzentsilbe ersichtlich ist. Das bedeutet, dass bei der Fokuszuweisung an die am tiefsten eingebettete Konstituente informationsstrukturelle Unterspezifikation vorliegt, durch die eine mehr oder weniger große Menge von alternativen Interpretationen ermöglicht wird. Erst durch die Beantwortung einer w Frage wird ermittelt, welche Konstituente in einem gegebenen Kontext den Fokus bildet. Zu dieser Konstituente kann bei Bedarf eine nichtausgewählte Alternative angeschlossen werden, wie in den obigen Beispielen geschehen. Ein Sprecher, der den Fokusakzent der am tiefsten eingebetteten Konstituente zuordnet, überlässt es also dem Interpreten, im aktuellen Kontext selbst eine geeignete Fokusinterpretation der Äußerung zu finden. Der Interpret muss herausfinden, welche genaue Frage der Sprecher ihm mit der Äußerung beantworten möchte. Die Entscheidung wird sich danach richten, welche Frage im gegebenen Kontext am sinnvollsten ist. Ein Sprecher wird also dann die am tiefsten eingebettete Konstituente seiner Äußerung fokussieren, wenn er – aus welchen Gründen auch immer – seinem Adressaten einen maximalen Interpretationsspielraum geben möchte.
Neben diesen Grundregeln zur Zuweisung des Fokusakzents gilt allerdings, dass bei Bedarf auch auf jede andere Konstituente innerhalb der Äußerung fokussiert werden kann. Entscheidend dafür ist, dass diese Konstituente als ausgewählt gekennzeichnet und zu nicht ausgewählten Alternativen in Kontrast gesetzt werden soll. Die Möglichkeit einer solchen Kontrastbildung besteht im Prinzip für fast jeden Teil einer Äußerung:
(23j) [angela MER\kel]F hat beim mittagessen im weißen haus einen früchteteller bestell nicht helmut KOHL\.
(23k) angela merkel hat [beim MIT\tagessen]F im weißen haus einen früchteteller bestelltund nicht zum FRÜH\stück.
(23l) angela merkel hat beim mittagessen [im /WEIßen HAUS\]F einen früchteteller bestellt – und nicht im /ROten RAT\haus.
In (23j l) kann sich das Fokusmerkmal weder nach links noch nach rechts ausbreiten, um eine größere Konstituente zu erfassen. Das fokussierte Satzglied und seine Nachbarsatzglieder sind von keinem gemeinsamen Symbol vollständig dominiert und bilden demnach keine Konstituente. Daher kann in den obigen Beispielen maximal dasjenige Satzglied zu Alternativen in Kontrast gesetzt sein, in dem der Fokusexponent liegt. Etliche Autoren (cf. Féry 1993: 22f.; Rabanus 2001: 42f.; Korth 2014: 233f.) verwenden dafür den Begriff „enger Fokus“ oder „Kontrastfokus“.
Unter Phrasierung versteht man die Einteilung von Äußerungen und Äußerungssequenzen in kleinere oder größere Redeabschnitte, die genau eine Intonationsphrase umfassen (cf. Duden 2016: 97). Zu den Hauptfunktionen, die Phrasierung erfüllt, zählen vor allem ihre delimitative und integrierende Funktion, i. e. die Möglichkeit, Äußerungseinheiten durch Melodieverlauf und Tonhöhenbewegungen voneinander abzugrenzen (delimitativer Aspekt) und als zusammengehörig auszuweisen (integrierender Aspekt).
Die Setzung von prosodischen Phrasierungsmarkern wird semantisch bestimmt. Diese Relation zwischen prosodischer und semantischer Repräsentation ist allerdings nicht direkt und macht sich vor allem an Knoten innerhalb der syntaktischen Phrasenstruktur fest (cf. Kohler 1995: 194). So wird gemeinhin davon ausgegangen, dass die prosodische Phrasierung eng mit der syntaktischen Phrasierung korreliert (Idee des Alignement). Dies dürfte daher rühren, dass die Grenzen von IP sehr häufig mit den Grenzen der syntaktischen Konstituenten wie Sätze und Teilsätze zusammenfallen. Das ist allerdings nicht immer der Fall. Die prosodische Einheitenbildung unterscheidet sich sowohl formal als auch funktional von der syntaktischen. Obwohl es in vielen Fällen zu einer Syntax Prosodie Deckungsgleichheit kommt, sind syntaktische und prosodische Gliederung getrennte Systeme, die einander unterstützen, aber auch eigene Wege gehen können: Syntaktische Einheiten dienen grundsätzlich dazu, semantisch konzeptuelle Einheiten zu kodieren; prosodische Einheiten werden dagegen aufgrund von pragmatischen Entscheidungen, z. B. von der Relevanz im gegebenen Interaktionskontext gebildet (cf. Blühdorn 2012: 161; Peters 2014: 86f.; Selkirk 1980: 285f.). Für jede semantisch konzeptuelle Einheit, die hinreichend wichtig ist, kann theoretisch eine eigene Intonationsphrase gebildet werden. Diese muss aber weder mit Sätzen noch mit syntaktischen Einheiten einhergehen und kann auch eine Wortkette umfassen, die im syntaktischen Sinne weniger komplex ist als ein Satz bzw. aus einem einzigen Wort besteht:
(24) {wer hat Bill erschossen?} <<OTTO.>>
Würde die Gliederung in Intonationsphrasen unmittelbar dem Ausdruck syntaktischer Eigenschaften dienen, könnte man außerdem Realisierungen dieser Art kaum erklären:
(25) <<man /MÜSSte wirklich unterSU\chungen anstellen>> <<ob die /NUTZung des festgelegten /SCHUTZbereichs effizient erHÖHT\ werden kann.>>
Bei der zweiten Intonationsphrase in (25) handelt es sich um einen nicht selbständigen Satz, der als Attribut zu dem vorher durch als Fokus markierten Substantiv Untersuchungen verwendet wird. In der syntaktischen Linearstruktur ist der ob Satz dem Nachfeld des vorigen Satzes (man müsste wirklich Untersuchungen anstellen) zuzuordnen; er ist also in seinen Vorgängersatz syntaktisch und semantisch integriert. Prosodisch bildet er hingegen eine selbständige IP4.
Für einige Fälle scheint es allerdings auch eindeutige Phrasierungstendenzen zu geben. In Bezug auf die Semantik von Kausalkonjunktoren wie denn und weil konnte beispielsweise nachgewiesen werden (cf. Blühdorn 2005: 323f.), dass die Erstreckung der Tongruppe syntaktische Abhängigkeitsverhältnisse signalisiert und damit indirekt auch die semantische Interpretation beeinflussen kann:
(26a) <<otto bleibt zu /HAU\se>> <<denn er hat keinen /RE\genschirm.>>
(26b) *<<otto bleibt zu hause denn er hat keinen /RE\genschirm.>>
(27a) <<otto bleibt zu /HAU\se>> <weil er keinen /RE\genschirm hat.>>
(27b) <<otto bleibt zu hause weil er keinen /RE\genschirm hat.>>
In parataktischen Kausalverbindungen wie (26a) müssen beide Teilsätze einen eigenen Hauptakzent tragen und somit zwei unterschiedlichen IP angehören. In hypotaktischen Verbindungen wie (27) können sie entweder einen eigenen Akzent tragen oder Teil derselben IP sein. Das lässt sich damit erklären, dass im ersten Fall beide Teilsätze assertiert werden, i. e. jeder von ihnen steht im Skopus eines illokutionären Operators, der eine eigene Fokus Hintergrund Gliederung stiftet; im zweiten Fall nur einer. Außerdem hat hier die syntaktische Struktur nicht nur Konsequenzen in der Prosodie sondern auch in der Semantik: Eine epistemische Interpretation (Überzeugung – Evidenz) der Kausalverbindungen ist z. B. nur dann möglich, wenn Ursache und Wirkung auf zwei IP mit eigenem Hauptakzent verteilt sind, wie in (26a) und (27a). Ist anderseits nur der Kausalsatz akzentuiert wie in (27b), dann muss die Kausalverbindung dispositionell (Ursache – Wirkung) gelesen werden (cf. ibd.: 324f.). Auch an Relativsätzen lassen sich bestimmte Phrasierungstendenzen erkennen: Restriktive Relativsätze stehen mit ihren Bezugseinheiten immer zusammen; appositive (oder nicht restriktive) Relativsätze können auch eigene Tongruppen bilden und zwischen Bezugselement und Relativpronomen eine Pause zulassen. Das ist darauf zurückzuführen, dass restriktive Relativsätze dadurch gekennzeichnet sind, dass sie ihr Bezugselement nicht nur näher charakterisieren, sondern auch in seinem Bedeutungsumfang einschränken; appositive Relativsätze dagegen fügen lediglich ein Merkmal zum Bezugsobjekt hinzu, das für das Verständnis des Satzes nicht notwendig ist (cf. Fox 1982: 100f.; Rabanus 2001: 60f.; Selkirk 1980: 24). So bestehen restriktive Gefüge wie in (28) aus einer einzigen Informationseinheit und nichtrestriktive wie in (29) aus zwei:
(28) <<die speisen <<die sie bereits ge/KOCHT haben>> liegen rechts im reGAL\.>>
(29) <<angela merkel>> <<die gerade ihren geBURTS\tag gefeiert hat>> <<hat zehn KI\lo abgenommen.>>
Ein letztes Kriterium, das für eine Zusammenwirkung von Syntax und Prosodie bei der Phrasierung spricht, ist schließlich die Möglichkeit, syntaktische Ambiguitäten prosodisch zu desambiguieren und Akkommodation zu erzwingen, wenn keine weitere Kontextinformation verfügbar ist. Typische Beispiele für prosodische Desambiguierung finden sich in Rechenoperationen wie (30) (cf. Korth 2014: 8), bei denen die Ambiguität mithilfe von prosodischer Phrasierung aufgelöst werden kann:
Je nachdem, wie wir die Konstituenten zusammenfassen, die zusammengehörigen Elemente in einer Phrasierungseinheit realisieren und durch prosodische Grenzen vom Rest der Rechnung trennen, bekommen wir zwei verschiedene Ergebnisse heraus. Zwei einfache Beispiele:
(31a) <<viktor heiratet maria nicht>>
(31b) <<viktor heiratet>> <<maria nicht>>
(32a) <<ich bedaure nicht>> <<gekommen zu sein>>
(32b) <<ich bedaure>> <<nicht gekommen zu sein>>
In (31) besteht die Mehrdeutigkeit in der Transitivität des Verbs: Ist es transitiv gebraucht (31a), dann bildet die gesamte Wortfolge einen einzigen Satz und eine einzige Informationseinheit. Ist es hingegen intransitiv (31b), dann sind es zwei Sätze mit eigenem Melodieverlauf – dabei ist der zweite Satz verbelliptisch und benötigt für seine richtige Interpretation einen syntaktischen Parallelismus mit seinem Antezedenten: Viktor heiratet, Maria tut es aber nicht. In (32) ist die Mehrdeutigkeit eher semantischer Natur und betrifft die Negation, die je nach Leseart entweder Skopus im Matrix(32a) oder im Infinitivsatz (32b) nehmen kann. Solche Ambiguitäten werden als „rechtsseitig“ oder „global“ bezeichnet, zumal sie zwei Anbindungsstellen aufweisen (eine an der Verbalphrase und eine andere an der Konstituente der Verbalphrase), zwischen denen der lesende Parser bei der Verarbeitung zu wählen hat.
Die prosodische Phrasierung kommt auch bei der Verarbeitung von sogenannten „Garden PathSätzen“ oder „lokal“ ambigen Sätzen zu Hilfe. Verglichen mit der globalen Ambiguität ist bei linksseitigen Ambiguitäten an dem Punkt, an dem die ambige Phrase verarbeitet wird, nur eine der möglichen Anbindungsstellen vorhanden; die andere wird durch material bereitgestellt, das später eingelesen wird. Das bedeutet, dass bei lokal ambigen Sätzen die Mehrdeutigkeit erst am Ende der Lektüre aufgehoben wird. Solche Ambiguitäten sind häufiger und benötigen eine ziemlich schwer zu verarbeitende Reanalyse. Ein Beispiel (in Anlehnung an Bader 1996: 11f.):
(33) dass Fritz zugunsten von Maria etwas unternommen worden wäre
(33a) … <<Fritz>> <<zugunsten von Maria>>…*
(33b) … <<fritz zugunsten>> <<von maria>>…
Da man beim Lesen von links nach rechts voranschreitet, induziert in diesem Fall den Satzanfang eine stark präferierte Leseart, die mit geringerem kognitivem Aufwand verbunden ist. Diese Lesart ist dafür verantwortlich, dass der lesende Parser die Phrase Fritz mit Vorliebe als Subjekt und zugunsten (von) vorerst als Präposition (33a) interpretiert und dies zu einem Zeitpunkt, wo noch keine Information über die restlichen Argumente und das Verb zur Verfügung steht. Sobald aber die passivische Verbform (worden wäre) auftritt und sich eine syntaktische Inkompatibilität herausstellt, so muss ein Mehraufwand im Arbeitsgedächtnis erfordert werden, der diese Lesart aufgrund der neuen syntaktischen Evidenz (Postposition + Komplement) auchunter prosodischen Gesichtspunkten reanalysiert5 (33b). Diese Herangehensweise wird auch empirisch durch die Leseexperimente von Bader (1996, 1998) belegt.
Unter Intonationskontur versteht man den Verlauf der Tonhöhe einer IP, i. e. die melodische Gestaltung einer Äußerung. Der wichtigste Melodieverlauf im Standarddeutschen ist dadurch gekennzeichnet, dass die Tonhöhe zunächst ansteigt, auf eine bestimmte Höhe verweilt und dann wieder absinkt. Tonhöhenveränderungen sind als Ergebnis eines Übergangs zu verstehen, der phonologisch unterschiedlich realisiert werden kann. Dabei spielt der tonale Kontrast zwischen Hochton (H) und Tiefton (L) in der Position des Akzenttons (mit einem * markiert) eine entscheidende Rolle, denn jeder Ton trägt eine feste abstrakte Bedeutung (cf. Duden 2016: 102f.):
Ein hoher Akzentton (H*) signalisiert, dass die Information, die durch den Akzent hervorgehoben wird, dem geteilten Wissen von Sprecher und Hörer hinzugefügt werden soll;
ein tiefer Akzentton (L*) zeigt hingegen an, dass die Information nicht dem geteilten Wissen von Sprecher und Hörer hinzugefügt werden soll, weil sie im Diskurskontext bereits präsent ist.
Wenn also ein steigender Akzent durch einen Tieftonakzent (L*H) realisiert wird, dann verweist er auf eine Information, die dem gemeinsamen Wissen der Gesprächspartner nicht hinzugefügt werden soll, weil sie eben schon vorhanden ist. Das wird als „bekanntes Topik“ bezeichnet; dagegen ist ein durch Hochtonakzent realisierter steigender Akzent (LH*) als „neues Topik“ auffassbar, der zum geteilten Wissen hinzuzufügen ist. Dasselbe gilt auch für die Kodierung von Foki: Ist der fallende Akzent durch einen Tieftonakzent (HL*) realisiert, dann gilt die durch den Akzent kodierte Information als im Diskurskontext der Gesprächspartner bereits bekannt („bekannter Fokus“); ist er demgegenüber durch einen Hochtonakzent kodiert (H*L), verweist dies auf eine noch nicht vorhandene Information („neuer Fokus“), die in den Diskurskontext eingeführt gehört (Blühdorn 2013: 259f.). Auch das Vorhandensein von Grenztönen (L% oder H%) trägt präzise Bedeutungsmerkmale. Grenztöne stehen für die Abgeschlossenheit der Information: Endet die IP mit einem hohen finalen Grenzton (H%), dann soll die Information der gesamten Intonationsphrase in Bezug zu dem, was folgt, interpretiert werden; ist hingegen ein tiefer finaler Grenzton (L%) vorhanden, enthält die IP einen in sich bereits abgeschlossenen Informationsschritt und soll nicht in Bezug zu dem, was folgt, interpretiert werden. Aus der Kombinierbarkeit von Akzentund Grenztönen lassen sich im Deutschen insgesamt fünf Konturtypen unterscheiden, denen besondere Bedeutungseigenschaften zugesprochen werden: fallend (H*L + L%), fallend steigend (H*L+ H%), hochsteigend (H* + H%), zweifach steigend (L*H + H%) und tief steigend (L*+H%) (cf. Duden 2016: 104 für einen weiterführenden Überblick).
Eine allgemein verbreitete, allerdings in der Bezugsliteratur auch vieldiskutierte Annahme besagt, dass die Wahl der Intonationskontur eng mit der syntaktischen Struktur korreliert. Häufig lässt sich tatsächlich eine gewisse Arbeitsteilung zwischen den beiden beobachten, die darauf zurückzuführen ist, dass beide Mittel teilweise gleiche Aspekte der Informationsstruktur zum Ausdruck bringen. Als Beispiel betrachte man folgende Beispielserie zur Nebenund Unterordnung, die freilich nach Peters (2014: 86f.) adoptiert wurde:
(34) zeigt insofern eine Harmonie, als sowohl syntaktische als auch prosodische Parataxe vorliegt: beide Aussagen sind sowohl syntaktisch als auch prosodisch gleichrangig. Der fallende Akzent auf betrunken und unglücklich ist dafür zuständig, dass beide Informationseinheiten als abgeschlossen und voneinander unabhängig sind. In (35) liegt syntaktische Parataxe aber prosodische Hypotaxe vor, denn der steigende Akzent bei betrunken signalisiert informatorische Unabgeschlossenheit. Das legt die Interpretation nahe, dass das Unglücklichsein von Paul damit zu tun hat, dass Ernia betrunken ist. In (36) liegt Hypotaxe sowohl auf syntaktischer als auch auf prosodischer Ebene vor. In (37) hingegen liegt syntaktische Hypotaxe aber prosodische Parataxe vor, i. e. dass die Abhängigkeit der ersten von der zweiten Information ausschließlich durch die Subordinierung des ersten Teilsatzes ausgedrückt wird. Offenbar reicht Parataxe auf einer der beiden Ausdrucksebenen aus, um die Interpretation nahe zu legen, dass die erste Aussage kommunikativ nicht unabhängig von der zweiten zu verstehen ist.
Ein weiteres Kriterium, das für eine Zusammenwirkung von Syntax und Konturwahl spricht, ist auch die Möglichkeit, syntaktische Ambiguitäten allein durch die Wahl der Intonationskontur aufzulösen (cf. Féry 1993: 140f.):
In (38a) handelt es sich um eine gespaltene Topikalisierung, bei der beide einen steigenden Akzent aufweist, im Gegensatz zu (38b), wo das Indefinitpronomen fallend realisiert wird. Die Wahl der Hutkontur in (38a) signalisiert, dass nicht beide Theaterstücke gespielt worden sind, sondern möglicherweise nur eins. So hat hier nicht Skopus über beide. In (38b) hingegen signalisiert der fallende Akzent auf beide, dass kein Theaterstück gespielt wurde. In diesem zweiten Fall hat beide Skopus über nicht. Außerdem kann die Form des Akzents auch bestimmen, wie eine Nominalphrase zu intendieren ist:
In (39a) deutet der Anstieg auf Kanzlerin, gefolgt von einem Fall auf gewählt, auf eine prädikative oder allgemeine Interpretation des Satzes hin. Der Satz kann folgendermaßen paraphrasiert werden: Wenn jemand Kanzlerin ist, dann wird sie gewählt. Der Fall auf Kanzlerin in (39b) impliziert hingegen eine referentielle Interpretation: Es ist die Kanzlerin, die gewählt wird.
Die in den obigen Seiten präsentierten Beispiele haben deutlich gezeigt, dass die Prosodie ein wichtiges Instrument ist, das die Syntax unterstützt und „manche Rätsel lösen kann, die die Syntax allein nicht löst“ (Féry 2006: 180). Zum einen hilft sie dabei, bereits aufgebaute syntaktische Strukturen zu reanalysieren und zum anderen kann sie dafür verantwortlich sein, welche Alternative im Falle von Ambiguität auszuwählen ist. Während die gesprochene Sprache meist genügend Hinweise hinsichtlich der syntaktischen und semantischen Struktur einer Informationseinheit liefert, muss beim Lesen erst die Prosodie auf den Text projiziert werden; der Leser muss also nicht ausschließlich auf Ketten von lexikalischen Einträgen achten, sondern auch eine prosodische Struktur aufrechterhalten, was für die Stiftung globaler sowie lokaler Textkohärenz positive Effekte erzielen kann.
Es wird im Folgenden versucht, die erläuterten Erkenntnisse in einem analytischen Werkzeug miteinander zu kombinieren und für die Analyse der prosodischen Beschaffenheiten eines schriftlichen Textes nutzbar zu machen. Zu diesem Zweck soll zuerst der Lesestrom in kleinere zusammengehörende Einheiten segmentiert werden; anschließend werden Position und Art der Tonhöhenakzente als Kodierungsmittel der Informationsstruktur ermittelt und schließlich die für jeden Leseabschnitt im jeweiligen Kontext präferierte Soll Intonation besprochen.6 Als Ausgangstext wird folgender online erschienener Text herangezogen:
Als Kopfzeile des Zeitungsartikels liefert der Satz als Antwort zur allgemeinen Kontextfrage {worum geht es?} die allererste Information zum Textthema. Es handelt sich dabei um einen Ganzfokus Satz, in dem jedes Segment – da im Diskurskontext noch nicht gegeben – F markiert sein muss. Der einzige fallende Akzent der Phrase liegt bei der ersten Silbe von Käsebrötchen, während die anderen Akzentsilben (Wein und Mett) einen steigenden Hochtonakzent aufweisen. Das ist bei Foki immer dann möglich, wenn es sich, wie in diesem Fall, um eine Aufzählung von asyndetisch gereihten Elementen handelt. Solche Titelund Präsentationsäußerungen, die hier eine für die Pressesprache typische verbelliptische Struktur aufweist, werden in der Literatur in Bezug auf einen bestimmten Fokustyp untersucht, der im Vergleich zum klassischen Fokus Informationen im Diskurs ergänzt, ohne explizit erfragt worden zu sein. Culicover/Rochemont (1983) sprechen hierbei von presentation focus (= Präsentationsfokus).
Betont werden in dieser Intonationsphrase die Silben rum, merund schlank; die Intonationskontur ist fallend (\). Im Gegensatz zu vielen anderen Sprachen (vor allem den romanischen Sprachen) besitzt die prototypische W Frage im Deutschen keinen steigenden, sondern einen fallenden Grenzton, genau wie beim prototypischen Aussagesatz. Der fallende Akzent liegt auf dem Adjektiv schlank. Er wird durch einen Hochton kodiert, der auf das erste Thema hinweist: Im Text geht es um die neue schlanke Figur der Kanzlerin. Die steigenden Akzente auf warum und angela merkel signalisieren zwei Topiks, die dafür zuständig sind, das Thema des”Schlankseins“ zu verengen und auf eine bestimmte Person, also die Kanzlerin (Angela Merkel), bzw. auf die Beschreibung der Gründe (Warum), die zum neuen Aussehen der Politikerin beigetragen haben, einzuschränken. Nach Verarbeitung der Schlagzeile wird nun klar, worauf sich die Aufmerksamkeit des Lesers konzentrieren soll, um den Informationsbedarf zu befriedigen. Es wird außerdem verdeutlicht, welche Funktion der zuvor eingeführte verbelliptische Satz (Kein Wein, keine Mettund Käsebrötchen) im Kohärenznetz erfüllt: Es handelt sich dabei um einen impliziten, nicht eingeleiteten Kausalsatz, der auf die Frage nach dem Warum? eine Antwort liefert und die Gründe bzw. die Mittel auflistet, die die Kanzlerin zum Abnehmen geführt haben könnten.
Fokusexponent ist hier das Wort figur, dessen zweite Silbe gur einen fallenden Hochtonakzent aufweist. Bei einer Kontextanbindungsfrage der Art {was hat Angela Merkel bei ihrem Besuch im Weißen Haus gemacht?}projiziert der informative Fokus über den eigentlichen Fokusexponenten hinaus und erreicht die ganze Nominalphrase (eine gute Figur). Diese Intonationsphrase weist ebenso Tonhöhenakzente auf, die vom Hintergrundmaterial (bei ihrem besuch, im weißen haus, hat, angela merkel, gemacht) steigend hervortreten und die zu befriedigende Mitteilung (was? > eine gute fiGUR) auf bestimmte Ereignisse einschränken wollen. Diese betreffen die Silbe such (bei ihrem beSUCH) und Haus (im weißen HAUS). Es handelt sich dabei um zwei Topiks, die den Gehalt der fokussierten Information auf eine bestimmte Zeit (bei ihrem Besuch – und nicht bei ihrem Urlaub etc.) und einen bestimmten Ort (im Weißen Haus – und nicht im Buckingham Palace etc.) verengen wollen. Da sie zum ersten Mal präsentiert und dem Diskurskontext neu hinzugefügt werden müssen, sind beide mit einem Hochtonakzent auszusprechen. Die Nominalphrase Kanzlerin Angela Merkel hingegen wurde im vorigen Kontext bereits erwähnt und bekommt daher einen Tieftonakzent.
In dieser IP steigt der Stimmdruck bei viel an und fällt nach der betonten Silbe frisch wieder ab. Semantisch bezieht sich der Satz auf den vorigen, mit dem er kausal verknüpft ist. Er nennt den Grund, warum Angela Merkel bei ihrem Besuch im Weißen Haus eine gute Figur abgegeben hat – etwa wie in der kontextuellen Frage {warum hat sie (bei ihrem Besuch im Weißen Haus) eine gute Figur gemacht?}. Aus diesem Grund breitet sich das Fokus vom Exponenten frischer auf die ganze Verbalphrase ([weil] sie sieht viel sportlicher und frischer aus) aus.
Auch diese IP zeigt eine Kausalanbindung zu IP 3 und koreferiert semantisch mit IP 4, denn beide liefern weitere Auskünfte über Merkels guten Eindruck im Weißen Haus. Der Fokusakzent liegt eher auf der Zahl zehn als auf dem Substantiv Kilo, denn das Thema „Schlanksein“, das mit Kilo einigermaßen semantisch verwandt ist, wurde schon eingeführt und bekommt deswegen einen Nebenakzent. Der Quantifikator bildet also die neue, dem Kontext hinzuzufügende Information der IP. Sein und runter befinden sich im postfokalen Hintergrund. Sie sind im common ground durch das Adjektiv schlank aus der Schlagzeile bereits präsent und bleiben aus diesem Grund unbetont.
Ein neues Thema wird eröffnet, bei dem es um die Enthüllung des Geheimnisses geht, das Angela Merkel zu dieser neuen Figur verholfen haben soll. Fokussiert ist die finite Verbformist, während das Substantiv Geheimnis zwar einen fallenden Akzent aufweist, aber einen alten Fokus signalisiert (Tieftonakzent). Es koreferiert mit den schon angesprochenen Gründen des schnellen und erfolgreichen Gewichtsverlusts Merkels, die in den vorigen Sätzen bloß angedeutet wurden und jetzt – wie das Verb sein selbst einleitet – ausführlicher präsentiert werden sollen.
F markiert ist die am tiefsten eingebettete Konstituente des Verbs (bleibenden Eindruck), die eine befriedigende Antwort auf die vom Kontext eröffnete Frage {was hat Angela Merkel in den USA gemacht?} liefert. Sie weist einen fallenden Hochtonakzent auf. Auch in dieser IP kann man von einer Fokusbzw. Topikprojektion ausgehen. Der Fokus dehnt sich vom Exponenten Eindruck über die ganze Verbalphrase (bleibenden Eindruck hinterlassen) aus. Das Topik breitet sich vom Topikexponenten USA zur gesamten Präpositionalphrase (in den usA) aus. Somit wird die Äußerung hinsichtlich des Ortes näher bestimmt; allerdings sollte diese Ortsangabe einen Tieftonakzent erhalten, da sie zu der in IP 3 bereits eingeführten Phrase (im Weißen Haus) in enger Verbindung steht. Bundeskanzlerin weist hier nicht die Eigenschaften eines neuen Topiks auf, der die Mitteilungsabsicht verengen soll; es handelt sich vielmehr um ein altes Topik, der im Text schon mehrmals vorkommt und bei dem der Druckanstieg nichts anderes bedeutet als die Eröffnung der IP.
IP 8 besteht aus einem komplexen Satz, der einen vorangestellten, abhängigen Vergleichssatz (Wie die Bild Zeitung online berichtet…) und einen Hauptsatz (sieht Angela Merkel viel sportlicher und frischer aus) umfasst. Der prominenteste Akzent des Nebensatzes liegt auf dem rechten Klammerteil (berichtet) und wird von einem steigenden Grenzton gefolgt, was auf seine – neben syntaktischer auch – prosodische Abhängigkeit hinweist: Das Konnekt ist unbedingt in Bezug auf das zu interpretieren, was noch folgt. Der Hauptsatz beantwortet demnach die Kontextfrage {was berichtet die Bild Zeitung?}. Da die durch den Fokus kodierte Information (viel sportlicher und frischer) schon zum zweiten Mal vorkommt (cf. IP 4) und als gegeben vorausgesetzt werden kann, sollten hier die jeweiligen Tonhöhenakzente durch Tieftöne (L*) realisiert werden.
Diese IP enthält eine kontrastierende Negation, an deren rechter Seite der negierte Ausdruck (zufällig) steht. Die Negation erhält hier einen Topikakzent, während negierter Ausdruck und Fokus zusammenfallen. Typisch für die kontrastierende Negation ist die Tatsache, dass zum negierten Ausdruck eine oder mehrere Alternativen zur Verfügung stehen, mit denen der Satz nicht zu negieren wäre. Das Topik steht hier zu Alternativen in Kontrast, unter denen weitere Partikeln auswählbar sind (nur, sogar, ja wohl etc.), für die die Frage auch positiv beantwortbar ist. Wie auch Blühdorn (2012: 207) betont, zeigt der Topikakzent auf nicht an, dass zunächst eine nicht auswählbare Alternative verfügbar ist, bei der ein sondern Anschluss zwar möglich bleibt, aber nicht obligatorisch ist.
Diese Intonationsphrase schließt an die vorige an, indem die Gründe von Merkels Schlanksein bekannt gegeben werden. Der Satz ist als direkter Gegensatz zu zufällig zu verstehen und erfüllt die Funktion des im vorigen Satz nicht gegebenen sondern Anschlusses. Wenn man beide Sätze verbinden würde, könnte man auf einen ungefähr so aussehenden Satz stoßen: Sie ist nicht zufällig schlanker geworden, sondern sie bevorzugt neuerdings Obst. Der Fokusakzent liegt auf dem direkten Objekt (Obst), dessen kommunikative Funktion durch das mit Topikakzent markierte Verb (beVORzuge) verengt wird. Der steigende Akzent auf dem Verb dient dazu, die Informationserwartung auf eine bestimmte Einstellung (bevorzugen, hassen, lieben etc.) einzuschränken. Die logische kontextuelle Frage lautet hier {nicht zufällig ist sie schlanker geworden, sondern? Was hat sie gemacht, um schlanker zu werden?}, was zur weiteren Annahme führt, dass der Fokus über die ganze Intonationsphrase hinausprojiziert und die Ganzfokussierung der IP bedingt.
Abgesehen von allen möglichen, oben bereits erläuterten Ausnahmen sieht die nicht markierte Struktur des deutschen Satzes eine Dativ Akkusativ Reihenfolge der Konstituenten im Mittelfeld vor. Wenn man aber, wie in dieser Intonationsphrase, eine bestimmte Konstituente als besonders prominent markieren will, gelten vor allem in der Schriftlichkeit einige Prinzipien, die eine Umstellung der Konstituentenabfolge ermöglichen. Bekanntheit kann z. B. der Auslöser von Voranstellung sein. In aller Regel werden bekannte Elemente nach links bewegt bzw. aus einer „Unbekanntheits Domäne“ (Musan 2002: 215) entfernt. Dass in dieser IP das Akkusativobjekt nach links gerückt wird, spricht also dafür, dass der Textproduzent nicht das bevorzugte Objekt (einen Früchteteller), sondern eher das betonen will, dem dieses Objekt vorgezogen wird (einer raffinierten Panacotta). Obwohl beide Ergänzungen im Text zum ersten Mal erscheinen, empfindet man Früchteteller als bereits bekannt, denn er steht im hyponymischen Verhältnis zu dem in IP 10 erwähnten Hyperonym „Obst“. Darüber hinaus ist es aus Weltwissen bekannt, dass man normalerweise Süßigkeiten gesunden Früchten vorzieht; das Gegenteil gilt erfahrungsgemäß als außergewöhnlich, was dazu führt, dass das indirekte Objekt in diesem Kontext als unbekannter empfunden wird und somit einen Hochtonakzent trägt. Was an der Informationsstruktur von dieser Äußerung noch auffällt, ist die markierte Reihenfolge der Topikelemente innerhalb des Mittelfeldes. Dass die Temporalangabe (am vergangenen Freitag) der Lokalangabe (beim Mittagsessen im Weißen Haus) folgt, spricht für eine Präferenz des Textproduzenten, die Zeitspanne hervorzuheben, in der sich das vom Fokus beschriebene Event ereignet. Das führt dazu, dass das Topik am vergangenen Freitag als informationsstrukturell wichtiger empfunden und prominenter ausgesprochen wird als die anderen, die wiederum im Diskurskontext bereits eingeführt worden waren (alte Topiks).
Mit diesem Satz zielt man darauf ab, über die Gründe Auskunft zu geben, die die Kanzlerin zum Abnehmen erzwungen haben. Die kontextuelle Frage, die das neue Thema ankündigt, sollte lauten {was ist der Grund für dieses Abnehmen? Was ist passiert?}. Der Fokusakzent fällt auf die erste Silbe des Wortes Beckenring und der Fokusbereich erstreckt sich über die ganze Verbalphrase, die die Informationserwartung befriedigt (den Beckenring angebrochen). Die Mitteilung wird anschließend mit zusätzlichen Informationen vervollständigt, die in Form von Topiks die Informationsgültigkeit zeitlich und lokal verengen. Bis auf Kanzlerin sollen hier alle Akzentsilben mit einem Hochton markiert werden, weil sie der Texthandlung neue Informationen hinzufügen.
Im Abschlusssatz werden die Folgen des Unfalls bekanntgegeben: Angela Merkel muss wochenlang im Bett liegen. {Was hatte der Unfall als Folge?} ist die kontextuelle Frage, auf die diese letzte Intonationsphrase antwortet. Vom Fokusexponenten Bettruhe projiziert der Fokus auf die gesamte Verbergänzung (zu wochenlanger Bettruhe). Besonders prominent ausgesprochen wird hier das Attribut wochenlang, das die einzige wirklich neue Information der IP darstellt. Das Substantiv Bettruhe ist zwar Teil des Fokus, es kann aber problemlos auch durch einen Tieftonakzent realisiert werden: Nach einem Skisturz ist es schon plausibel anzunehmen, dass man eine Zeit lang zu Bettruhe verurteilt wird. Dasselbe gilt auch für das Subjekt (die Ärzte), das in dieser IP Topikfunktion erfüllt: Zwar wird dadurch die Gültigkeit des Fokus auf eine bestimmte Agens Gruppe eingeengt (Ärzte, Krankenschwestern, Sanitäter etc.), es ist aber durch eigenes Weltwissen weitaus erschließbar, dass diese Entscheidung von Ärzten oder sonstigen mit der medizinischen Welt handelnden Menschen getroffen wird, was letztendlich dazu führt, dass auch die hier enthaltene Akzentsilbe (ÄRZ) tief ausgesprochen bleiben kann.
Wie in den vorigen Seiten diskutiert, werden im Leseprozess zuerst einzelne Propositionen extrahiert und dann auf einer höheren Verarbeitungsebene Propositionsfolgen miteinander verknüpft, Inhalte von Sätzen und Textabschnitten aufeinander bezogen und zu einer kohärenten Textbedeutung integriert. Die Rekonstruktion der Textbedeutung setzt also die Herstellung lokaler und globaler Kohärenz voraus. Dabei muss der Lesende alle Hinweise nutzen, die ihm der Text und der einbettende Kontext selbst geben: Dazu gehören Inferenzen und Elaborationen, verschiedene Formen von Koreferenzen und Konnektoren, aber auch unterschiedliche intonatorische Gestaltungen.
Die phonologische Rekodierung des schriftlichen Textes stellt wichtige Verbindung zwischen syntaktischer Struktur und Bedeutung dar und ist dafür zuständig, prosodische Strukturen zu erzeugen, die für das vollständige Verstehen von Sprache unumgänglich sind. Wenn das aber in der Muttersprache automatisch verläuft, soll der nicht muttersprachliche DaF Lernende dafür sensibilisiert werden, beim Leseverstehen solch eine Soll /Soll Nicht Intonation in Anspruch zu nehmen und den syntaktischen Einheiten die für den jeweiligen Kontext sowie für die Stiftung der Textkohärenz richtigen informationsstrukturellen Kategorien und Tonhöhenakzente zuzuordnen. Gerade aus diesem Grund müsste das Training phonologischer Bewusstheit – i. e. der Fähigkeit, die lautliche Struktur einer Sprache zu erkennen bzw. bewusst und adäquat einsetzen zu können – bei der Förderung der Lesekompetenz eine Schlüsselrolle spie len.
Durch präzise Hinweise und didaktische Instruktionen könnte versucht werden, die in diesem Aufsatz besprochenen Erkenntnisse in die DaF Lesepraxis zu erproben und daraus ein methodologischer Ansatz (cf. Cosentino 2019; Missaglia 2011) zu entwickeln. Anhand unterschiedlicher Textsorten (wie Märchen, Gedichte, Dialoge, Filmszenen) könnten Fremdsprachler in die Lage versetzt werden, den Lesestrom als eine Abfolge von prosodischen Segmenten zu erfassen und die Aufteilung in Intonationsphrasen einzuüben. Dabei wird die Aufmerksamkeit zuerst auf IP Grenzen gerichtet. In einem nächsten Analyseschritt werden die Lernenden zur Setzung von Äußerungsakzenten sowie zur Zuweisung informationsstrukureller Rollen eingeleitet. Zwei einfache Regeln bestimmen die Übung: Pro informative Einheit darf nur ein einziger Fokusakzent realisiert werden, wobei alle anderen Äußerungsteile, die nicht mit diesem Akzent versehen sind, bewusst zu deakzentuieren sind. Um Fokusund Hintergrundbereich ermitteln und voneinander unterscheiden zu können, sollen die einzelnen aufeinanderfolgenden Textstellen mit Bezug auf den Vorgängertext durch präzise Kontextfragen (w Fragen) erfragt werden. Wichtig ist hierbei auch zu ermitteln, ob die Äußerungsakzente einen tiefen oder einen hohen Akzentton enthalten. Töne bestimmen nämlich die Relation zwischen propositionalem Gehalt des hervorgehobenen Äußerungsteils und bereits konstruiertem Wissen des Lesers um den Text. Mit anderen Worten: Sie legen den Kontext fest und signalisieren, welche Textbezüge im Prozess der Rekonstruktion der Texthandlung als neu, alt, relevant, nicht relevant, überraschend etc. einzustufen sind.
Erste empirische Untersuchungen dazu (cf. Cosentino 2015) lieferten bereits eindeutige Hinweise darauf, dass eine prosodiegeleitete Heranführung an den fremdsprachigen Text dem Nicht Muttersprachler zu besseren Verstehensresultaten verhelfen kann. Dennoch ist hier weiterführende Forschungsarbeit nötig. Eine wesentliche Aufgabe dieser sollte demnach darin bestehen, weitere Analysen zu diesem Thema bereitzustellen und die Ergebnisse der unterschiedlichen Forschungsrichtungen noch stärker in die Praxis zu integrieren.