SGLKapitel3: Das Lesen von Sonagrammen

Das Lesen von Sonagrammen V1.0 - Kapitel III

Zur Lautunterscheidung innerhalb der Lautklassen:
Bestimmung der Artikulationsstelle

Kirsten Machelett

Inhalt:

Zur Unterscheidung der Vokale
Die Bedeutung von Lokus und Transition für die Konsonantidentifikation
Zur Unterscheidung der Plosive
Glottal-Stop vs. Plosiv
Zur Unterscheidung der Frikative
/r/-Realisationen
- 6.1 Uvularer Trill, Frikativ und Glide
- 6.2 Alveolarer Trill und Glide
Fragen

IPA - SAMPA Tabelle laden und ausdrucken !

Zur Unterscheidung der Vokale

Wie bereits im vorherigen Kapitel besprochen, unterscheiden sich die Vokale durch die Lage ihrer Formanten. Im Sonagramm entscheidet sowohl ihre absolute Lage als auch die Lage dieser Formanten zueinander über ihre Identifikation. Die beiden Formanten F1 und F2 können eng beieinander oder weit auseinander, hoch, mittel oder tief auf der Frequenzachse liegen.

Vielfach entnimmt man die Formantwerte der Vokale den Formanttabellen (Vgl. Kap. II.1 "Vokale") oder Formantkarten, die Durchschnittswerte der üblichen Formantfrequenzen enthalten. Dabei ist jedoch zu berücksichtigen, daß Tabellen, die nicht verschiedene Werte für Männer, Frauen und Kinder enthalten, in der Regel Durchschnittswerte von männlichen Sprecherstimmen angeben.

Aufgrund der durchschnittlich kürzeren Ansatzrohrlänge bei Frauen und besonders Kindern liegen bei ihnen die Formantfrequenzen um einiges höher. Bei Frauenstimmen können die Differenzen beim ersten Formanten F1 bis etwa 200 Hz, bei F2 sogar bis zu 500 Hz betragen (vgl. dazu auch Abbildung 2.1 in Kapitel II). So erscheint es beim Lesen von Sonagrammen wesentlich sinnvoller, sich entweder an den Werten des neutralen Schwa-Lautes oder, besser noch, an der Formantlage der Kardinalvokale /i, a, u/ als an absoluten Formantwerten zu orientieren. Nichts anderes geschieht ja auch bei der auditiven Erkennung der Vokalqualität bei den verschiedenen Sprecherstimmen von Mann, Frau und Kind.

Der enge Zusammenhang zwischen Artikulation und Akustik läßt sich bei den Vokalen besonders anschaulich verdeutlichen, da ein Zusammenhang sowohl zwischen Zungenhöhe und erstem Formanten F1 als auch zwischen Zungenposition und zweitem Formanten F2 besteht. Lippenrundung nimmt ebenfalls Einfluß auf F2.

Abb. 3.1: Die Kardinalvokale /i, a, u/ im Vergleich

F1 - Zungenhöhe
Das Sonagramm in Abbildung 3.1 zeigt die Kardinalvokale /i/, /a/, /u/. Betrachten wir den ersten Formanten F1, so stellen wir fest, daß dieser bei den hohen Vokalen /i/ und /u/ sehr niedrig bei etwa 350 Hz, beim tiefen Vokal /a/ dagegen hoch bei etwa 850 Hz liegt. Mit sinkender Zungenhöhe steigt der erste Formant F1. Den höchsten F1 hat das /a/.

F2 - Zungenposition und Lippenrundung
Desweiteren stellen wir vom /i/ über /a/ zum /u/ einen fallenden zweiten Formanten F2 fest. Demnach sinkt mit nach hinten verschobener Zungenposition der Wert von F2. Die gleiche Wirkung hat Lippenrundung auf F2. Durch Verlängerung des Ansatzrohres im vorderen Bereich verschiebt sich die Zungenposition relativ gesehen nach hinten, was zur Absenkung von F2 führt. Die Sonagramme in Abbildung 3.2 zeigen die Auswirkung von a) Lippenrundung der vorderen Vokale und b) Entrundung der hinteren Vokale auf den zweiten Formanten. Lippenrundung bei beibehaltener Zungenposition und -höhe führt zur Absenkung, Lippenspreizung bzw. eine neutrale Lippenstellung zur Anhebung von F2. So hat das hohe, gespreizte /i/ den höchsten, das gerundete, hintere /u/ den tiefsten zweiten Formanten.

Abb. 3.2a: Auswirkung von Lippen-Rundung auf F2 der vorderen Vokale [i e ]

Abb. 3.2b: Auswirkung von Lippen-Entrundung auf F2 der hinteren Vokale [u o]

. Auch solle man von "Länge der oralen Resonanzhöhle" statt von Zungenposition sprechen.

F1 - Grad der artikulatorischen Öffnung
Er schloß, "es gibt einen direkten Zusammenhang zwischen dem Ansteigen des ersten Formanten und dem Öffnungsgrad des Oraltraktes: Je kleiner der Grad der artikulatorischen Öffnung, desto tiefer die Frequenz des F1 und umgekehrt." Den Grad der artikulatorischen Öffnung definierte er als Distanz "zwischen dem höchsten Punkt der Zunge und den am nächsten gelegenen Punkt des Palatums", also der engsten Stelle zwischen Zunge und Gaumen.

F2 - Länge der oralen Resonanzhöhle
Die Länge der oralen Resonanzhöhle definierte er als den Grad der Zurückgezogen- und Angehobenheit der Zunge und den Grad der Lippenrundung. Je weiter hinten angehoben und damit zurückgezogen die Zunge ist, desto länger wird die Mundhöhle. Ihre Länge vergrößert sich ebenfalls mit zunehmender Lippenvorstülpung, sprich -rundung. So sinkt mit zunehmender Länge der oralen Resonanzhöhle der zweite Formant.

Für unsere Zwecke genügt in der Regel der etwas 'gröbere' Zusammenhang zwischen den traditionellen artikulatorischen Vokal-Beschreibungskategorien "Zungenhöhe" und "Zungenposition" und den Formanten F1 und F2, um die einzelnen Vokale im Sonagramm zu identifizieren. Diese Zusammenhänge lassen sich durch Erweiterung des bekannten, nur leicht modifizierten Vokalschemas veranschaulichen, wie es die Abbildung 3.3 zeigt.

Abb. 3.3: Vokalschema zur Verdeutlichung des engen Zusammenhangs zwischen Akustik und Artikulation

Wir werden die Vokale im Sonagramm in einem ersten Analyseschritt immer in vordere und hintere Vokale einteilen, da sich diese Gruppen am leichtesten voneinander unterscheiden lassen.

1.1 Vordere Vokale

Das Sonagramm in Abbildung 3.4 zeigt die Folge vorderer ungerundeter Vokale [i e E]. Kennzeichen der vorderen (auch gerundeten) Vokale ist a) eine sehr große Distanz von bis zu 2000 Hz zwischen erstem und zweiten Formanten und b) ein hoher F2, weswegen man sie als a) "diffuse" (verteilt) und b) "acute" (spitz, scharf) bezeichnet. Der Abstand zwischen F1 und F2 der vorderen Vokale verringert sich mit abnehmender Zungenhöhe, da F1 ansteigt und F2 sinkt.

Abb. 3.4: Die vorderen Vokale [i e E]

1.2 Hintere Vokale

Kennzeichen der hinteren Vokale ist a) ein sehr enges Zusammenliegen der ersten beiden Formanten b) im unteren Frequenzbereich bis ungefähr 1000 Hz, weswegen man sie als a) "compact" und b) "grave" (schwer, dumpf) bezeichnet. Beide Formanten F1 und F2 liegen oft so eng zusammen, daß sie aufgrund ihrer Bandbreiten nicht mehr voneinander zu unterscheiden sind. Wie die Folge hinterer Vokale in Abbildung 3.5 zeigt, verändert sich der Abstand zwischen den beiden Formanten nur geringfügig mit der Zungenhöhe. Allerdings steigen beide Formanten mit abnehmender Zungenhöhe an. Nicht eigentlich in die Reihe der hinteren Vokale gehörend ist das hier produzierte, zentrale /a/. Seine Formantwerte liegen nicht "compact" im unteren, sondern im mittleren Frequenzbereich um 1000 Hz.

Abb. 3.5: Die hinteren Vokale [u o O] und der Zentralvokal [ a]

"acute", "grave", "diffuse" und "compact" sind Merkmalsbezeichnungen, die den "Distinctive Features" von JAKOBSON, FANT und HALLE (1969) entnommen sind.

1.3 Zentrale Vokale

Die Formanten des neutralen Schwa sind äquidistant, ihre Abstände liegen bei etwa 1000 Hz. Das gilt sowohl für den Abstand zwischen F1/F2 als auch zwischen F2/F3. Im Vergleich dazu liegen F2 und F3 bei den vorderen Vokalen meist sehr eng zusammen, wohingegen sie bei den hinteren weit auseinander liegen. Eine gewisse Äquidistanz ist das Kennzeichen aller Zentralvokale [@ 6 a]. Hinzu kommt als wichtiges Merkmal ein zweiter Formant im Bereich zwischen 1000 und 1500 Hz.

Die mittleren zentralen Vokale [@] und [6] werden häufig reduziert gesprochen, so daß im Sonagramm nur ein sehr kurzer Zeitbereich die Formantbestimmung ermöglicht. Diese Tatsache wiederum ermöglicht es jedoch, generell einen reduzierten Vokal mit hoher Wahrscheinlichkeit als Zentralvokal richtig zu identifizieren.

Die Abbildung 3.6 zeigt Sonagramme der zentralen Vokale [@ 6 a].

Abb. 3.6: Die zentralen Vokale [@ 6 a]

Die Bedeutung von Lokus und Transitionen für die Konsonantidentifikation

Den Lauten einer Lautklasse ist der Artikulationsmodus gemeinsam. Sie unterscheiden sich aber durch ihre Artikulationsstelle. Die Artikulationsstelle wiederum hat entscheidende Auswirkungen auf die Ansatzrohrkonfiguration und damit auch auf die Resonanzverhältnisse im Ansatzrohr bei der Lautbildung. Für die Bestimmung der Artikulationsstelle eines Lautes und damit seiner endgültigen Identifikation im Sonagramm gibt es je nach Lautklasse verschiedene Methoden.

Während Vokale sich eindeutig durch ihre Formantwerte voneinander unterscheiden und Frikative relativ klar durch den Intensitätsschwerpunkt des Friktionsgeräuschs gekennzeichnet sind, ist es besonders bei Nasalen und Plosiven oft problematisch, ihre Artikulationsstelle zu bestimmen. In solchen Fällen wird man versuchen, sich an den Transitionen, also den Formantverläufen der angrenzenden Vokale zu orientieren.

Eine besondere Rolle spielt hierbei der zweite Formant, wie bereits POTTER, KOPP und GREEN-KOPP (1966) feststellten. Sie bezeichneten die Lage des zweiten Formanten eines jeden Sprechlauts als 'hub' und definierten ihn als "sichtbare oder verdeckte Position des zweiten Formanten eines jeden isoliert gesprochenen Lautes". Die sichtbare Position des zweiten Formanten ist uns durch die Betrachtung der Vokale bekannt. Auch bei stimmhaften Konsonanten wie beispielsweise Lateralen und Frikativen zieht sich meist ein schwaches Frequenzband durch den Laut, das wir als F2 identifizieren können. Was aber vesteht man unter einem unsichtbaren bzw. verdeckten zweiten Formanten? Und vor allem, wie erkennt man ihn im Sonagramm, damit er auch bei der Sprachlautidentifikation von Nutzen ist?

Man denke sich dabei unsichtbare Formanten, deren Lage lediglich an den Grenzen zu vokalischen Segmenten anhand ihrer Transitionen, d.h. ihrer artikulatorischen und akustischen Übergänge, erkennbar wird. Diesen F2- 'hub' bezeichnen wir nach DELATTRE, LIBERMAN und COOPER (1955) als Lokus eines Lautes. Sie prägten diesen Begriff, als sie mit Hilfe der 'Pattern-Playback-Methode' selbstgezeichnete Sonagramme wieder hörbar machten, um so verschiedene Transitionsverläufe zur Perzeption von Plosiven zu testen. Sie definierten den Lokus eines Plosivs als imaginären Punkt auf der Frequenzachse ca. 50 ms vor der Verschlußlösung des Plosivs. Er wird als der virtuelle Ausgangspunkt der F2-Transitionen von einem Plosiv zu den F2-Werten aller möglichen folgenden Vokale betrachtet.

Aufgrund ihrer Synthese-Experimente kamen sie zu dem Schluß, daß der Lokus von [b] bei 720 Hz, von [d] bei 1800 Hz und bei [g] in Kombination mit vorderen Vokalen bei 3000 Hz liege. Vor hinteren Vokalen liege der Lokus des [g] unter 1000 Hz. Sie glaubten, die artikulatorische Signifikanz dieser Loki sei begründet durch die bei der Lautbildung invariante Vokaltrakt-Konfiguration. ÖHMAN (1966) und FANT (1969) beobachteten jedoch eine zusätzliche Abhängigkeit der Loki von den anliegenden Vokalen. Öhman stellte fest, daß die Variabilität der Formanttransitionen in VC-Folgen kontrolliert wird durch den folgenden Vokal. Da 'Spuren' des Folgevokals bereits in den Transitionen vom Initialvokal zum Konsonanten zu sehen sind, muß geschlossen werden, daß die Artikulationsbewegungen zum Folgevokal bereits zu Beginn der Verschlußphase des Konsonanten einsetzen.

Die elegante, weil sehr einfache Lokus-Theorie läßt sich also in ihrer ursprünglichen Form - leider - nicht mehr halten, da der Verlauf der Plosivtransitionen, und ganz besonders auch ihr imaginärer Ausgangspunkt während der Verschlußphase, sowohl vom vorausgehenden als auch vom Folgevokal beeinflußt wird.

Vergleichen wir nun die Loki und Transitionen der Artikulationsmodi Plosiv, Nasal und Frikativ bei jeweils gleicher Artikulationsstelle. Die Abbildung 3.7a zeigt die Artikulationsstellen 'labial' und Abbildung 3.7b die Artikulationsstellen 'alveolar' jeweils in Verbindung mit dem Zentralvokal /a/, also im symmetrischen Vokalkontext.

Abb. 3.7a: Der Lokus 'labial' in [abamava]

Der Vokal [a] zeigt bei allen drei Artikulationsmodi Plosiv [b], Nasal [m] und Frikativ [v] der Artikulationsstelle 'labial' negative Transitionen.

Abb. 3.7b: Der Lokus 'alveolar' in [adanaza]

Bei der Artikulationsstelle 'alveolar' dagegen finden wir für F2 und F3 positive Transitionen. Demnach scheint der 'labiale' Lokus niedriger als der F2 des [a] zu liegen, der 'alveolare' Lokus aber oberhalb des zweiten Formanten von [a]. Wir erkennen also recht gut die artikulationsstellen-bedingten akustischen Gemeinsamkeiten bei Konsonanten verschiedener Artikulationsmodi bei gleicher Artikulationsstelle.

Stark vereinfacht bezeichnen wir nun als Lokus bei labialen Konsonanten ein Wert von etwa 700 Hz, bei alveolaren von etwa 1800 Hz und bei palatalen und velaren Werte zwischen 2000 Hz und 3000 Hz.
Diese Werte dürfen jedoch lediglich als grobe Orientierungshilfe verstanden werden und bedürfen besonders bei der Artikulationstelle 'velar' eines Kommentars. Denn diese Artikulationsstelle variiert sowohl bei Plosiven wie auch bei Frikativen nicht unerheblich in Abhängigkeit von den angrenzenden Vokalen. Weitgehend bekannt ist dies bei den Plosiven [k, g], doch auch beim Frikativ [x] wurde dieses Phänomen beobachtet. Darauf werden wir in den folgenden Kapiteln noch näher eingehen.

Zur Unterscheidung der Plosive

Plosive lassen sich im Sonagramm anhand verschiedenster Merkmale unterscheiden. In diversen Untersuchungen - meist mit synthetischen Lautfolgen - wurden distinktive Merkmale für die Erkennung und Unterscheidung der Plosive herausgearbeitet. An diesen 'Cues' werden wir uns beim Sonagramm-Lesen orientieren, wenngleich sie bei spontansprachlichen Äußerungen nicht immer deutlich genug ausgeprägt sind, um für die Analyse verwertbar zu sein. Als Hinweis auf die Artikulationsstelle eines Plosivs gelten:

sein Lokus bzw. die Transitionen vom vorausgehenden oder zum folgenden Vokal,
die Transitionsdauern,
die spektrale Zusammensetzung des Verschlußlösungsgeräusches, dem Burst,
die Intensität des Bursts.

Im Deutschen unterscheiden wir für die Plosive die Artikulationsstellen labial, alveolar und velar. Die Artikulationsstelle 'velar' variiert zusätzlich in Abhängigkeit des angrenzenden Vokals.

3.1 Diskrimination anhand der Loki bzw. der Formanttransitionen

Dieses Merkmal bietet sich nur bei Plosiven in vokalischer Umgebung an. Zur Orientierung seien nochmals die Lokus-Werte von DELATTRE, LIBERMAN und COOPER (1955) genannt:

 
 
    labial:     bei 720 Hz, 
    alveolar:   bei 1800 Hz, 
    velar:      bei 3000 Hz in Kombination mit vorderen Vokalen, 
                unter 1000 Hz vor hinteren Vokalen.

Auch wenn die Lokus-Theorie in ihrer ursprünglichen Form nicht mehr gilt, kann uns der Verlauf der Transitionen vom Vokal zum Plosiv und vom Plosiv zum Vokal doch wichtige Aufschlüsse über die Artikulationsstelle geben.

LABIAL:
Fallen F1, F2 und F3 zum Plosiv hin (negative Transitionen), ist das ein klares Indiz für einen bilabialen Plosiv, unabhängig vom Vokalkontext. Das Sonagramm in Abbildung 3.8 zeigt die fallenden Transitionen vom [b] zu den Folgevokalen [i e E a o u].

Abb. 3.8: Der labiale Plosiv [bi be bE ba bo bu]: fallende Transitionen und schwacher Burst

ALVEOLAR:
Verlaufen F2 und F3 quasi parallel vor einem nicht-hinteren Vokal, d.h. sie sind beide steigend, fallend oder waagerecht, deutet das auf einen alveolaren Plosiv. Scheinen sich F2, F3 und F4 zu Beginn eines folgenden hinteren Vokals in einem Punkt bei etwa 2500 Hz zu treffen, ist das ebenfalls ein klarer Hinweis auf einen alveolaren Plosiv. Das Sonagramm in Abbildung 3.9 zeigt die Transitionen vom [d] zu den Folgevokalen [i e E a o u].

Abb. 3.9: Der alveolare Plosiv [di de dE da do du] [di de dE da]: Lokus 1800 Hz, Transitionen parallel, [do du]: F2 bis F4 konvergieren bei etwa 2500 Hz

VELAR:
Ein Zusammenlaufen von F2 und F3 ist dagegen bei nicht-hinteren Vokalen ein Hinweis auf einen velaren Plosiv. Folgt einem velaren Plosiv ein hinterer Vokal, sind aufgrund des tiefen Lokus für die hintere Version von [g, k] keine Transitionen erkennbar. Das Sonagramm in Abbildung 3.10 zeigt die Transitionen vom [g] zu den Folgevokalen [i e E a o u].

Abb. 3.10: Der velare Plosiv [gi ge gE ga go gu] F2/F3 konvergieren (außer vor den hinteren Vokalen [u] und [o]), keine Transitionen bei [u] und [o] zu erkennen.

Transitionen lassen sich jedoch nur auswerten, wenn sie in ihrer Lage und Richtung deutlich zu erkennen sind und wenn an den Plosiv mindestens ein vokalisches Segment angrenzt. Bei aspirierten Plosiven kann dies zu Problemen führen, besonders wenn die Aspiration eine niedrige Intensität aufweist. In diesem Fall ist die für die Transition verantwortliche artikulatorische Bewegung häufig schon abgeschlossen, bevor die Stimmbandschwingung wieder einsetzt. Dies gilt bereits bei einer Aspirationsphase, die länger als 40 ms dauert. Eine intensive Aspirationsphase jedoch kann sehr wohl deutliche Formantverläufe aufweisen. In solchen Fällen wie auch bei Affrikaten geben uns möglicherweise die Transitionen eines vorausgehenden Vokals zum Plosiv Aufschluß über die Artikulationsstelle des Plosivs. In Abbildung 3.11 deuten fallende Transitionen des vorausgehenden Vokals in der Äußerung "heb" auf einen labialen Plosiv, die Transitionen der Äußerungen "Matsch" und "Mut" dagegen auf einen Lokus in der Gegend von etwa 1800 Hz und damit auf einen alveolaren Plosiv.

Abb. 3.11: heb, Matsch, Mut [hepH, matS, mutH]. Transitionen des vorausgehenden Vokals bei [hepH] fallend, bei [matS] und [mutH] auf 1800 Hz steigend

Bei der Beurteilung des Verlaufs einer Transition sind immer Ausgangs- und Zielposition der artikulatorischen Bewegungen zu bedenken. Diese sind direkt von der Plosivumgebung abhängig. Haben Vokal und Plosiv dieselbe Artikulationsstelle, d.h. beide sind homorgan, ergeben sich nur geringfügige Artikulationsbewegungen. Die Folge davon ist ein neutraler Transitionsverlauf des zweiten Formanten. Ein solcher Fall ist bei [di], [ti], [gu] und [ku] gegeben. Vergleichen wir dazu den Weg und die Lage der Zunge bei den Folgen [di] und [du] in Abbildung 3.12. Die Transition des zweiten Formanten F2 verläuft bei der homorganen Folge [di] neutral, während wir bei der Folge [du] einen fallenden Verlauf von F2 feststellen. Die Zunge ist beim [d] bereits vorne angehoben, wie es die [i]-Artikulation erfordert, während sie für die [u]- Artikulation vorne gesenkt und hinten angehoben werden muß.

Abb. 3.12: neutrale vs. deutliche Transition in [di] vs. [du] , F2: bleibt gleich vs. fällt.

3.2 Diskrimination anhand der Transitionsdauer

Die verschlußbildenden Artikulatoren (Lippen, Zungenspitze und Zungenrücken) sind nicht gleich gut beweglich. Sie bewegen sich mit unterschiedlichen Geschwindigkeiten, wobei die Zungenspitze die schnellsten Bewegungen vollführt. Demzufolge wird ein apikaler Verschluß schneller gebildet als ein velarer. Grundsätzlich ist jedoch neben der Beweglichkeit der Artikulatoren auch der Grad der 'artikulatorischen Nähe' zweier benachbarter Laute, was ihre Artikulationsstelle betrifft, verantwortlich für die Dauer der Transition.

Ein weiterer Aspekt ist die Tatsache, daß die Artikulatoren beim bilabialem Plosiv und angrenzendem Vokal, nämlich Lippen und Zunge, voneinander unabhängig sind, während beim alveolaren und velaren Plosiv nur die Zunge jeweils Artikulator ist. Sie muß erst ihre Vokalstellung aufgeben, damit der Verschluß gebildet werden kann. Und der Verschluß muß bereits wieder gelöst worden sein, bevor die Vokaltransitionen beginnen können. Für die bilabialen Plosive gilt das Gegenteil: die Zunge kann bereits während der Verschlußphase die Vokalposition einnehmen. So kann im stark koartikulierten Fall eine sichtbare Vokaltransition ganz fehlen, da der artikulatorische Übergang bereits während der Verschlußphase stattgefunden hat.

3.3 Diskrimination anhand der Burst-Frequenz bzw. des Burst-Spektrums

Bei Untersuchungen zur spektralen Zusammensetzung des Verschlußlösungsgeräusches, dem Burst, fanden HALLE, HUGHES und RADLEY (1957) signifikante Unterschiede bei allen Plosiven. Danach läßt sich die Artikulationsstelle eines Plosivs am Spektrum seines Bursts zweifelsfrei erkennen.

LABIAL:
Eine Energiekonzentration im unteren Frequenzbereich zwischen 500 Hz und 1000 Hz zeigt einen bilabialen Plosiv an.

ALVEOLAR:
Ist das Spektrum flach oder dominiert im oberen Frequenzbereich über 4000 Hz, handelt es sich um einen alveolaren Plosiv. Zusätzlich gibt es eine Energiekonzentration bei 500 Hz. Der alveolare Burst weist häufig eine unterbrochene Struktur auf, was ihm das Aussehen einer 'gestrichelten Linie' verleiht.

VELAR:
Eine hohe Energiekonzentration im mittleren Frequenzbereich zwischen 1500 Hz und 4000 Hz kennzeichnet den velaren Plosiv. In der Regel findet sich eine punktförmige Energiekonzentration von bis zu 500 Hz Bandbreite im Sonagramm. Die Lage des Schwerpunkts hängt vom folgenden Vokal ab. Er liegt vor den vorderen, ungerundeten Vokalen [i I e E] am höchsten mit Werten zwischen 2000 Hz und 3000 Hz, vor den vorderen gerundeten [y Y 2 9] und den zentralen [@ 6 a] zwischen 1200 Hz und 1800 Hz, bei den hinteren unter 1000 Hz.

Nachdem es jedoch meistens schwierig sein wird, die spektrale Zusammensetzung eines derart kurzen Zeitraumes wie dem eines Bursts nur mit Hilfe des Sonagramms zu bestimmen, scheint dieses Merkmal für den Sonagrammleser nur bedingt nutzbar. Eine schwächere Burst-Intensität, wie sie bei stimmhaften Plosiven üblich ist, kommt erschwerend hinzu.

3.4 Diskrimination anhand der Burst-Intensität

Der Zusammenhang zwischen Artikulationsstelle und Intensität des Bursts läßt sich folgendermaßen darstellen. Je größer der orale Resonanzraum, d.h. der Mundraum, in dem der Plosionslärm entsteht, desto ausgeprägter ist das Plosionsgeräusch.

LABIAL:
Das bedeutet konkret für den bilabialen Plosiv die schwächste Burst- Intensität und auch das kürzeste Verschlußlösungsgeräusch.

VELAR:
Eine längere Plosionsdauer mit intensiverem Burst finden wir bei velaren Plosiven. Aufgrund der breiten Verschlußfläche des Zungenrückens können dort mehrere Verschlußlösungen nacheinander auftreten - ein typisches Merkmal velarer Plosive.

Die folgende Abbildung 3.13 zeigt Plosionsgeräusche aller drei Artikulationsstellen: den schwachen bilabialen Burst, die unterbrochene Linie des alveolaren Burst, sowie den klaren Burst-Schwerpunkt und die Mehrfachlösung des velaren Plosivs.

Abb. 3.13: /p, t, k/ Plosiv-Bursts isoliert produziert.
Labial [p]: schwach,
Alveolar [t]: gestrichelt,
Velar [k]: Burst-Schwerpunkt,
Velar [k]: Mehrfachlösung und Burst-Schwerpunkt bei ca. 2300 Hz.

3.5 Zusammenfassung

Anhand welchen Merkmals wir die Artikulationsstelle eines Plosivs bestimmen, hängt von der jeweiligen Ausprägung der Merkmale ab.

LABIAL:
Ein labialer Plosiv zeichnet sich durch negative Transitionen der ersten drei Formanten F1 bis F3 aus. Bei angrenzenden Vokalen mit hohem F2 verlaufen diese Transitionen sogar sehr steil, sofern der überwiegende Teil des artikulatorischen Übergangs nicht bereits während der Verschlußphase stattgefunden hat. Der Burst ist häufig nur sehr schwach ausgeprägt mit einer Energiekonzentration im unteren Frequenzbereich.

ALVEOLAR:
Um einen alveolaren Plosiv zu identifizieren, orientieren wir uns zum einen an seinem Lokus bei etwa 1800 Hz, von dem die Transitionen meist ausgehen. Um jede Verwechslung mit dem variablen, velaren Plosiv auszuschließen, achten wir zusätzlich auf den Burst, der bei alveolaren Plosiven häufig eine unterbrochene Struktur und keine Mehrfachlösungen aufweist. Konvergieren F2 und F3 vor einem hinteren Vokal, spricht das ebenfalls für einen alveolaren Plosiv.

VELAR:
Einen velaren Plosiv erkennen wir meist sehr gut an der Mehrfachverschlußlösung und einer zentralen Burst- Frequenz zwischen 1000 Hz und 3500 Hz. Auch konvergierender F2 und F3 sind ein verläßliches Erkennungszeichen, sofern der Plosiv nicht an einen hinteren, sondern an einen vorderen oder mittleren Vokal angrenzt.

Grundsätzlich - und besonders bei stimmlos aspirierten Plosiven - orientieren wir uns zusätzlich an den Transitionen des vorausgehenden Vokals zum Plosiv hin. Die Erkennung von Plosiven in nicht vokalischer Umgebung (d.h. es grenzen weder Vokal noch Nasal noch Lateral an) bereitet meist größere Schwierigkeiten. Hier können uns lediglich Struktur und Intensität des Bursts einen gewissen Hinweis geben. Möglicherweise wird uns auch phonotaktisches Wissen über die Wahrscheinlichkeit oder gar Möglichkeit, einen bestimmten Plosiv in der bereits erkannten Laut-Umgebung anzutreffen, bei seiner Identifikation hilfreich sein.

Glottal-Stop vs. Plosiv

Es gibt verschiedene Merkmale des glottalen Verschlußlautes, die ihn von den übrigen Verschlußlauten des Deutschen unterscheiden.

Dem Glottal-Stop folgt immer ein Vokal.
Die Verschlußphase eines Glottal-Stops ist immer stimmlos.
Es gibt keine Aspirationsphase.
Es sind mehrere Verschlußlösungen möglich, wobei ihr Abstand zum folgenden Vokal bis zu dreimal so groß sein kann wie der zwischen zwei regulären Stimmbandschwingungen des Folgevokals.
Der glottale Burst weist mehrere Bereiche hoher Energiekonzentration auf, die den Formantwerten des nachfolgenden Vokals entsprechen.
Es treten keine Formantransitionen vom glottalen Burst zum Folgevokal auf.

Formanttransitionen beobachten wir lediglich bei Vokalübergängen, in denen der Glottal-Stop zur Glottalisierung reduziert ist. Bei diesen durchgehend glottalisierten Vokalübergängen verlaufen Transitionen vom einen zum anderen Vokal in einer Phase von 'creaky voice'. Die Unterscheidung zwischen Glottalisierung und glottalem Verschlußlaut wurde in Kapitel 2.3 beschrieben. Die Sonagramme in Abbildung 3.14 zeigen eine Gegenüberstellung von Plosiv und Glottal-Stop in Form von Minimalpaaren.

Abb. 3.14: Plosiv vs. Glottal-Stop in Minimalpaaren. "Banner, dumm, geben" vs. "?Anna, ?um, ?eben"

Die obere Sonagramm-Reihe zeigt die Plosive [b, d, g] in den Äußerungen "Banner, dumm, geben", wo wir die Merkmale 'stimmhafte Verschlußphase' und 'Transitionen zum Folgevokal' finden. Dagegen beobachten wir bei den mit Glottal- Stop beginnenden Äußerungen "Anna, um, eben" der unteren Reihe einen deutlichen Abstand zwischen Verschlußlösung und Vokalbeginn sowie Burst-Schwerpunkte bei den Formantfrequenzen der Vokale.

Zur Unterscheidung der Frikative

Die Klasse der Frikative ist im Deutschen die größte Lautklasse. Neben den meist spontan genannten Artikulationsstellen labiodental [f, v], alveolar [s, z], postalveolar [S, Z], palatal [ç, j] und velar [x] gehören aber auch das glottale /h/ und einige Allophone des /r/-Phonems zu dieser Klasse. Frikative /r/-Realisationen werden an der Artikulationsstelle uvular [X, RR] gebildet. Die Vielfalt dieser Klasse macht es nicht immer leicht, alle sieben Artikulationsstellen im Sonagramm auseinander zu halten.

Im folgenden Kapitel wird jeder Frikativ einzeln mit seinen typischen Eigenschaften vorgestellt, ausgenommen die /r/-Realisationen [X, RR]. Diese werden im nächsten Kapitel III.6 gemeinsam mit den übrigen, im Deutschen vorkommenden /r/-Varianten behandelt. Bei sehr schwer unterscheidbaren oder erkennbaren Frikativen wie z.B. initiale Frikative wird auf Kapitel IV.2 verwiesen. Dort werden sog. Problemfälle gesondert behandelt.

Stimmhaft vs. stimmlos
Grundsätzlich sind stimmhafte von stimmlosen Frikativen abzugrenzen. Abgesehen von dem 'voice bar' zeichnen sich stimmhafte Frikative durch eine geringere Intensität und meist kürzere Dauer als die stimmlosen Versionen aus. Bei stimmhaften Frikativen sind zuweilen Formantstrukturen gut zu erkennen. Auch Transitionen sind in vokalischer Umgebung besonders an den Grenzen stimmhafter Frikative deutlich ausgeprägt.

Ein wichtiges Merkmal besonders zur Unterscheidung der hinteren Artikulationsstellen ist neben den Transitionen die spektrale Zusammensetzung des Frikativschalls, sein Schwerpunkt und seine Gesamtintensität. Das Frikativspektrum wird - wie bereits in Kapitel II.7 beschrieben - durch die Passage des frikativen Grundschalls von dem Ort der Engebildung bis zur Mundöffnung geprägt. Je länger die Passage, desto tiefer sind die am Mund abgestrahlten Frequenzen, bzw. ihr Gesamtschwerpunkt. Wir sprechen dabei von 'artikulatorischer Tiefe', die sich als 'akustische Tiefe' bemerkbar macht, was die Lage des Frequenzschwerpunktes betrifft. Für das Aussehen der Frikative im Sonagramm bedeutet das konkret: Je weiter hinten die Artikulationsstelle des Frikativs liegt,

desto tiefer liegt auf der Frequenzachse die untere Grenze des Frikativschwerpunktes (Vgl. [s] und [S]) und
desto strukturierter ist das Frikativspektrum.

Das Sonagramm in Abbildung 3.15 zeigt Frikative der Artikulationsstellen alveolar, postalveolar und glottal im Vergleich. Der Frequenzschwerpunkt sinkt mit zunehmender artikulatorischer Tiefe.

Abb. 3.15: Frikative [sa Sa ha]

Das Sonagramm in Abbildung 3.16 zeigt Frikative der Artikulationsstellen labiodental, palatal und velar im Vergleich. Mit zunehmender artikulatorischer Tiefe zeigt der Frikativ stärkere Resonanzstrukturen.

Abb. 3.16: Frikative [fu çu xu]

Kommen wir nun zu einer systematischen Beschreibung der Frikative. Begonnen wird mit der Artikulationsstelle der geringsten artikulatorischen Tiefe.

5.1 Labiodental [f v]
Das Spektrum labiodentaler Frikative ist flach. Ihre Energie ist gleichmäßig über alle Frequenzbereiche verteilt mit einer leichten Energiekonzentration im obersten Frequenzbereich oberhalb von 6000 Hz. [f] und [v] sind - besonders im Vergleich zu [s] und [S] - Frikative geringer Energie. Die Abbildung 3.17 zeigt den stimmlosen und stimmhaften labiodentalen Frikativ in verschiedenen Vokalkontexten.

Abb. 3.17: Die labiodentalen Frikative [f] und [v] jeweils im Vokalkontext [i a u]

Das stimmhafte [v] erkennt man häufig nur an 'voice bar', schwacher Energie im obersten Frequenzbereich und den negativen Transitionen angrenzender Vokale.

5.2 Alveolar [s z]
Das Spektrum der alveolaren Frikative weist insgesamt eine sehr hohe Intensität auf. Es gibt eine Energiekonzentration im Bereich von 5000 Hz bis 8000 Hz. Die Untergrenze des Energieschwerpunktes kann bei angrenzenden hinteren Vokalen um bis zu 1000 Hz tiefer liegen. Die Abbildung 3.18 zeigt den stimmlosen und stimmhaften alveolaren Frikativ in verschiedenen Vokalkontexten.

Abb. 3.18: Die alveolaren Frikative [s] und [z] jeweils im Vokalkontext [i a u]

5.3 Postalveolar [S Z]
Postalveolare Frikative weisen im Zeitsignal die stärkste Energie, d.h. die höchste Amplitude auf. Dadurch weisen sie im Sonagramm einen sehr hohen Schwärzungsgrad auf. Ihr Energieschwerpunkt liegt im Bereich von 2500 Hz bis 7000 Hz. Damit liegt ihr Schwerpunkt um bis zu 2500 Hz tiefer als bei den alveolaren Frikativen. Die Schwerpunktsuntergrenze variiert ebenfalls je nach angrenzendem Vokal. Abbildung 3.19 zeigt den stimmlosen und stimmhaften postalveolaren Frikativ in verschiedenen Vokalkontexten.

Abb. 3.19: Die postalveolaren Frikative [S] und [Z] jeweils im Vokalkontext [i a u]

5.4 Palatal [ç j]
Palatale Frikative sind wesentlich intensitätsschwächer als alveolare oder postalveolare. Ihr Frequenzschwerpunkt reicht hinunter bis ca. 3000 Hz und kann bereits formantähnliche Strukturen aufweisen. Damit liegt ihre Schwerpunktuntergrenze über der der postalveolaren Frikative.
Dieses Faktum widerspricht dennoch nicht dem Gesetz der artikulatorischen Tiefe, da sich beim postalveolaren Frikativ [S] die vordere Mundraumpassage durch Lippenrundung verlängert. Dadurch liegt dieser, absolut gemessen, von der Mundöffnung weiter hinten als der palatale Frikativ.
Abbildung 3.20 zeigt den stimmlosen und stimmhaften palatalen Frikativ in verschiedenen Vokalkontexten. Die besonders beim stimmhaften [j] schon erkennbaren formantähnlichen Strukturen erinnern an den Vokal [i].

Abb. 3.20: Die palatalen Frikative [ç] und [j] jeweils im Vokalkontext [i a u]

5.5 Velar [x]
Der velare Frikativ [x] zeichnet sich durch Friktionsenergie bis in die untersten Frequenzbereiche aus und läßt sich dadurch vom palatalen [ç] unterscheiden. Sein Spektrum weist eine relativ gut ausgeprägte formantähnliche Struktur auf. Sie variiert zwar in Abhängigkeit von den angrenzenden Vokalen, entspricht aber nicht - anders als beim glottalen /h/ - deren Formantstruktur.

Die Artikulationsstelle des velaren Frikativs kann sich nach hinten bis zur Artikulationsstelle uvular [X] verschieben. Das beobachten wir vor allem vor hinteren tiefen Vokalen wie [a] oder [O] in den Worten "Dach" und "doch". Nach hohen und mittleren hinteren Vokalen wie [u] und [o] tritt die velare Version [x] auf.

Zur Unterscheidung von [x] und [ç] kann im Deutschen der vokalische Kontext hinzugenommen werden, der entscheidet, welches /ch/-Allophon produziert wird, da beide distributive Allophone des Phonems /ch/ sind. So taucht das [x] niemals nach vorderen Vokalen oder initial auf. Das [ç] dagegen kann sowohl initial als auch im Diminuitivsuffix "-chen" nach jedem Vokal auftreten. Abbildung 3.21 zeigt das [x] in den Äußerungen "doch", "Dach" und "Tuch".

Abb. 3.21: Der velare Frikativ [x] in den Äußerungen "doch", "Dach" und "Tuch".

5.6 Glottal [h< ipa147>]
Der glottale Frikativ ist ein stark koartikulierter Laut. Dennoch kann man - entgegen früherer Annahmen - nicht von einem dem Folgevokal entsprechenden geflüsterten Laut sprechen. Untersuchungen mittels spektraler Analysen der beiden Autoren IIVONEN (1970) und KEATING (1988) ergaben folgende Merkmale für den glottalen Frikativ:

Das /h/ bezieht seine Vokalqualitäten aus dem phonetischen Kontext, d.h. sowohl aus dem vorausgehenden als auch dem folgenden Vokal.

Auch im vokalischen Kontext zeigen sich im Bereich von 300 Hz bis 2400 Hz keine Transitionen an den Grenzen des Frikativs.

Im symmetrischen Vokalkontext (d.h. vorausgehender = folgender Vokal) weist das /h/ im Bereich von 300 Hz - 2400 Hz die Formantstrukturen der angrenzenden Vokale auf. Das zeigen die Sonagramme der Lautfolgen [ihi] und [aha] in Abbildung 3.22.

Abb. 3.22: Der glottale Frikativ /h/ im symmetrischen Vokalkontext [ihi] und [aha].

Im asymmetrischen Vokalkontext (d.h. vorausgehender Vokal entspricht nicht dem folgenden Vokal) verlaufen die F1- und F2-Transitionen vom ersten zum zweiten Vokal deutlich sichtbar quer durch das /h/.
Das Sonagramm in Abbildung 3.23 zeigt die Vokaltransitionen vom [i] zum [a], die über die gesamte Dauer durch das /h/ verlaufen.

Lediglich der dritte Formant F3 scheint konstant und damit unabhängig vom Vokalkontext und /h/-immanent zu sein. Er liegt zwischen 2500 Hz und 2800 Hz.

Abb. 3.23: Vokaltransition durch das /h/ in [iha]

Das /h/ steht im Deutschen nur vor Vokal und im Morphemanlaut. Es kann sowohl stimmhaft als auch stimmlos realisiert werden. Untersuchungsergebnisse von STOCK (1971) weisen eine starke Tendenz zur Stimmhaftigkeit von /h/ nach. Sie findet sich sowohl zwischen stimmlosem Laut und Vokal als auch in initialer Position, wenn auch häufig erst in der zweiten Hälfte des Lautes.

Die Signalintensität ist besonders in initialer Position sehr niedrig, so daß das /h/ vielfach an der unteren Auflösungsgrenze liegt. Fehlende Stimmhaftigkeit (kein 'voice bar') erschwert sein Identifizieren im Sonagramm zusätzlich. Die Realisationsdauer liegt zwischen 20 ms und 150 ms, wobei 60% der initialen Realisierungen nur 30-40 ms dauern. Folgende Durchschnittswerte wurden ermittelt:

 
 
        Dauer des /h/     		Durchschnitt  	Bereich 
    in stimmhafter Umgebung     	74 ms        	30-150 ms 
    nach stimmlosem Segment 		52 ms        	20-100 ms 
    initial              		42 ms        	20-80 ms

Der glottale Frikativ entspricht akustisch prinzipiell dem Aspirationsgeräusch nach stimmlosen Plosiven. Nach BLUHME (1965) lassen sich das [h] und die Aspiration als kombinatorische Varianten des Phonems /h/ auffassen. Die Aspirationsphase kann ebenfalls Formantstrukturen in Form von Transitionen vom Plosiv zum nachfolgenden Vokal aufweisen.

5.7 Zusammenfassung
Wir können zusammenfassend sagen, daß die untere Frequenzgrenze (d.h. die Untergrenze des frikativen Frequenzschwerpunktes) des im Sonagramm sichtbaren Rauschens mit zunehmender artikulatorischer Tiefe sinkt. Gleichzeitig beeinflußt die vokalische Umgebung diese Untergrenze. Ein hoher F2 des angrenzenden Vokals führt zu einer leichten Anhebung, ein tiefer F2 zur Absenkung dieser Grenze. So kann sie bei vorderen Vokalen zwischen 500 Hz und 1000 Hz höher liegen als bei hinteren Vokalen. Besonders deutlich wird dies, wenn Vokale unterschiedlicher Qualität angrenzen. Dann steigt oder fällt die Untergrenze im Verlauf des Frikativs von einem Vokal zum anderen. Das Sonagramm in Abbildung 3.24 zeigt dies am Beispiel vom [i] mit hohem F2 zum [u] mit tiefem F2 in der Äußerung "Mischung".

Abb. 3.24: [iSu] in "Mischung": Die Frikativuntergrenze zeigt Transitionen von [i] zu [u].

Mit zunehmender artikulatorischer Tiefe weist der Frikativ auch zunehmend formantähnliche Strukturen auf. Das gilt insbesondere für die Frikaive [ç], [x] und [h]. Um sie anhand ihrer Position (Stellung) innerhalb einer Äußerung unterscheiden zu können, gibt folgende Tabelle eine vergleichende Übersicht, in welchen Positionen sie jeweils im Standarddeutschen vorkommen können.

 
 
            Position 			[ç] 	[x]	 [h] 
    initial          			ja  	nein	 ja 
    final            			ja  	ja  	 nein 
    nach vorderen Vokalen   		ja  	nein	 ja 
    nach hinteren Vokalen   		ja  	ja  	 ja 
         (Diminuitiv: -chen) 
    vor Konsonanten (Kompo- 
    sita ausgenommen)  		 	ja  	ja 	 nein

/r/-Realisationen

Das Spektrum phonetisch verschiedener /r/-Realisationen ist sehr weit gespannt und variriert sprecherspezifisch, kontextspezifisch und dialektabhängig. Es reicht vom Trill [r, R] im Süddeutschen Raum über den Glide [rr] in einigen südwestfälischen Dialekten und verschiedene frikative Versionen im norddeutschen Raum bis hin zum vokalisierten [6] in silbenfinaler Position.

Die Artikulationsstellen reichen von alveolar [r, rr] über velar [x] bis hin zu uvular [R, RR, X]. Die frikativen Versionen können sowohl stimmhaft [RR] wie stimmlos [X] sein. Ebenso häufig beginnen sie stimmhaft, um dann ins Stimmlose überzugehen oder umgekehrt. Doch immer bezeichnen wir sie mit demselben Graphem "r". Diese Vielfalt sollten wir beim Lesen und Identifizieren von Lauten im Sonagramm immer im Gedächtnis behalten. Ganz besonders dann, wenn sich frikative oder vokalische Segmente mit den bereits erkannten Nachbarsegmenten nicht zu sinnvollen Phonemverbindungen oder Wörtern zusammensetzen lassen.

Das ist auch der Grund dafür, warum dieses Kapitel im Vergleich zu den anderen Kapiteln anders aufgebaut ist. Wurden die Laute bisher im Rahmen ihrer Lautklasse, geordnet nach ihrem Artikulationsmodus, vorgestellt, werden hier die möglichen Allophone eines Lautes präsentiert, obwohl sie verschiedene Artikulationsmodi haben und damit unterschiedlichen Lautklassen angehören. Die Beschreibung der /r/-Allophone wird im Folgenden gruppiert nach ihrer Artikulationsstelle vorgenommen.

6.1 Uvularer Trill, Frikativ, Glide
Die beiden postdorsal-uvularen Allophone [R] und [RR] werden an derselben Artikulationsstelle gebildet, unterscheiden sich jedoch durch Art und Grad der Engebildung. Das [R] wird als Vibrant oder Trill, das [RR] als Engelaut bzw. Frikativ klassifiziert.

Nach KRÄMER (1979) sind diese beiden Allophone akustisch durch ein relatives Maximum von F3 und ein relatives Minimum von F4 charakterisiert. Die Unterscheidung dieser beiden Allophone im Sonagramm bereitet aufgrund ihres unterschiedlichen Artikulationsmodus keine großen Probleme. Jeder Schlag eines mehrfach geschlagenen Trills [R] besteht - wie bereits in Kapitel 2.6 "Trills" beschrieben - aus zwei Phasen. Die Anzahl der Schläge wird mit Hilfe der 'Signallücken' bestimmt.

Das [RR] hingegen zeichnet sich durch eine homogenere, mehr oder weniger stark frikative Struktur aus. Ein in der Regel gut ausgeprägtes Merkmal des [RR] ist die Annäherung von drittem und viertem Formanten im Zentrum des Frikativs bei etwa 3000 -3500 Hz. Diese Annäherung von F3 und F4 bezieht sich nicht nur auf die Transitionen angrenzender Vokale, wie wir es von der F2/F3- Annäherung bei velaren Plosiven kennen. Beim [RR] gewinnt man den Eindruck, als kreuzten sich dritter und vierter Formant im Verlauf des Frikativs. Dies geschieht weitgehend unabhängig vom vokalischen Kontext. Es wurde sowohl bei angrenzendem Plosiv als auch bei beidseitig angrenzenden Vokalen beobachtet.

Die Sonagramme in Abbildung 3.25 zeigen das [RR] mit konvergierendem F3/F4 in den Äußerungen "Bahre", "Grat", "verrät" und "ruht".

Abb. 3.25: Beim [RR] in "Bahre", "Grat", "verrät" und "ruht" kreuzen sich F3 und F4.

Eine zunehmende Entfernung zwischen F3 und F4 zeigt den abnehmenden Grad artikulatorischer Enge an. Gleichzeitig läßt sich eine Abnahme der Gesamtintensität des Signals beobachten. Nach stimmlosen Plosiven und Frikativen besonders innerhalb desselben Wortes wird [RR] meist entstimmt, wie in "trat", oder vollständig stimmlos als [X] produziert, wie in "scharrt". Die stimmlose Version [X] kann aber durchaus auch in beidseitig vokalischer Umgebung auftreten, wie das Sonagramm in Abbildung 3.26a am Beispiel von "verriet" zeigt, besonders wenn vordere hohe Vokale angrenzen.

Abb. 3.26a: Das [RR] kann auch in vokalischer Umgebung stimmlos sein: [X] in "verriet"

Gelegentlich finden wir eine teils stimmhafte Realisation, die im zweiten Teil stimmlos wird, wie im Beispiel "brat" in Abbildung 3.26b zu sehen ist.

Abb. 3.26b: Das [RR] in "brat" ist erst im zweiten Teil stimmlos.

Das uvulare r-Allophon [RR] kann besonders vor hinteren Vokalen intervokalisch zu einem Approximanten (Glide) werden. Im IPA gibt es dafür kein eigenes Zeichen, so daß wir dasselbe Symbol verwenden, aber entweder vom Frikativ oder vom Approximanten [RR] sprechen. Im Sonagramm zeichnet sich der Approximant durch eine teilweise bis vollständige Reduktion des frikativen Signalanteils aus. Man sieht lediglich die ersten beiden Formanten des Approximanten. Sie liegen deutlich unter 1000 Hz, was dem Laut in vokalischem Kontext das Aussehen einer 'Mulde' verleiht. Das Sonagramm in Abbildung 3.27 zeigt den uvularen Approximanten in der Äußerung "verruht".

Abb. 3.27: Der uvulare Approximant (Glide) in "verruht".

6.2 Alveolarer Trill und Glide
Der alveolare Trill [r] ist vom uvularen Trill [R] anhand zweier Merkmale zu unterscheiden.

Die Schläge des [r] sind regelmäßiger und in der Regel friktionsfreier als die des [R] (vgl. Abb 3.28).

Die ersten vier Formanten konzentrieren sich beim [r] auf den Frequenzbereich bis 3000 Hz. In den offenen Phasen dieses intermittierenden Verschlusses bilden sich F3 und F4 bei einer Frequenzdistanz von nur 500-600 Hz im Breitband- Sonagramm leicht als ein einziges spektrales Maximum aus, was leicht zur Interpretation als extrem breitbandigem F3 verführen kann. Im Unterschied zum [RR] kreuzen sich F3 und F4 jedoch nicht, sondern verlaufen paerallel.

Die Intermissionsfrequenz der beiden Trills [r,R], d.h. die Frequenz ihrer Phasen maximalen Verschlusses, liegt bei 23-26 Hz.

Abb. 3.28: Der alveolare [r] und der uvulare [R] Trill [r] im Vergleich (isoliert produziert).

Da die Realisierung des /r/ als alveolarer Glide [rr] im Deutschen äußerst selten ist, soll der Glide hier nur ganz grob skizziert werden. Wir finden ihn beispielsweise in einigen Dialektgebieten Südwestfalens. Im Englischen dagegen wird das /r/-Allophon grundsätzlich als alveolarer Glide realisiert.
Die Zunge wird dabei nach oben zurückgebogen, so daß die Unterseite der Zungenspitze mit den Alveolen eine Enge bildet. Im Sonagramm ähnelt der Glide einem hinteren Vokal. Formanten der angrenzenden Vokale scheinen - wie bereits beim uvularen Approximanten beschrieben - zum [rr] hin eine Art 'Mulde' zu bilden. Lediglich Frequenzen bis 1000 Hz haben eine hohe Intensität. Anders jedoch als beim uvularen Approximanten liegen die beiden ersten Formanten nicht unter 1000 Hz. F1 liegt etwa bei 350 Hz, F2 bei 1100 Hz und F3 zwischen 1600 Hz und 2000 Hz).

Fragen

Welchen Einfluß haben Zungenhöhe, Zungenposition und Lippenrundung auf die beiden ersten Formanten?
Welche Formantlage ist charakteristisch für vordere, hintere und mittlere Vokale?
TRANSITIONEN
Welche Formanttransitionen erwarten wir an den Grenzen zu einem labialen Konsonanten?
PLOSIVE
Welche Merkmale eines Plosivs helfen uns bei der Bestimmung seiner Artikulationsstelle?
Um welche Plosiv-Artikulationsstelle handelt es sich, wenn zweiter und dritter Formant a) eines vorderen bzw. b) eines hinteren angrenzenden Vokals konvergieren?
Für welchen Plosiv spricht ein deutlicher Burst-Schwerpunkt und Mehrfachverschlußlösungen?
Anhand welcher Merkmale unterscheiden wir Glottal-Stop und Plosiv?
FRIKATIVE
Erläutern Sie die Begriffe 'akustische Tiefe' und 'artikulatorische Tiefe' anhand der Frikative im Sonagramm!
Wodurch kann man den alveolaren vom postalveolaren Frikativ im Sonagramm unterscheiden?
Wodurch kann man den palatalen vom velaren Frikativ im Sonagramm unterscheiden?
Welchen Einfluß haben angrenzende Vokale auf die Untergrenze des Frequenzschwerpunkts bei Frikativen?
/r/
Mit welchen Artikulationsstellen und Artikulationsmodi kann das Phonem /r/ realisiert sein?
Welche akustischen Eigenschaften zeichnen das /r/ realisiert als uvularer Frikativ aus?
Wie können wir alveolaren und uvularen Trill unterscheiden?

Antworten

Weiter zu KAPITEL IV

Copyright © 1996 Institut für Phonetik und Sprachliche Kommunikation, Universität München
Diese und alle weiteren hier referenzierten Seiten mit der Initiale 'SGL' im Filenamen dürfen kopiert, gedruckt und an Dritte weitergegeben werden, unter der Bedingung, daß jede Seite vollständig bleibt. Weitergabe von Auszügen nur mit Erlaubnis der Urheber.