Bestimmung der Artikulationsstelle
Kirsten Machelett
IPA - SAMPA Tabelle laden und ausdrucken !
Vielfach entnimmt man die Formantwerte der Vokale den Formanttabellen (Vgl. Kap. II.1 "Vokale") oder Formantkarten, die Durchschnittswerte der üblichen Formantfrequenzen enthalten. Dabei ist jedoch zu berücksichtigen, daß Tabellen, die nicht verschiedene Werte für Männer, Frauen und Kinder enthalten, in der Regel Durchschnittswerte von männlichen Sprecherstimmen angeben.
Aufgrund der durchschnittlich kürzeren Ansatzrohrlänge bei Frauen und besonders Kindern liegen bei ihnen die Formantfrequenzen um einiges höher. Bei Frauenstimmen können die Differenzen beim ersten Formanten F1 bis etwa 200 Hz, bei F2 sogar bis zu 500 Hz betragen (vgl. dazu auch Abbildung 2.1 in Kapitel II). So erscheint es beim Lesen von Sonagrammen wesentlich sinnvoller, sich entweder an den Werten des neutralen Schwa-Lautes oder, besser noch, an der Formantlage der Kardinalvokale /i, a, u/ als an absoluten Formantwerten zu orientieren. Nichts anderes geschieht ja auch bei der auditiven Erkennung der Vokalqualität bei den verschiedenen Sprecherstimmen von Mann, Frau und Kind.
Der enge Zusammenhang zwischen Artikulation und Akustik läßt sich bei den Vokalen besonders anschaulich verdeutlichen, da ein Zusammenhang sowohl zwischen Zungenhöhe und erstem Formanten F1 als auch zwischen Zungenposition und zweitem Formanten F2 besteht. Lippenrundung nimmt ebenfalls Einfluß auf F2.
Abb. 3.1: Die Kardinalvokale /i, a, u/ im Vergleich
F1 - Zungenhöhe
Das Sonagramm in Abbildung 3.1 zeigt die Kardinalvokale /i/, /a/, /u/. Betrachten wir
den ersten Formanten F1, so stellen wir fest, daß dieser bei den hohen Vokalen
/i/ und /u/ sehr niedrig bei etwa 350 Hz, beim tiefen Vokal /a/ dagegen hoch bei etwa
850 Hz liegt. Mit sinkender Zungenhöhe steigt der erste Formant F1. Den
höchsten F1 hat das /a/.
F2 - Zungenposition und Lippenrundung
Desweiteren stellen wir vom /i/ über /a/ zum /u/ einen fallenden zweiten
Formanten F2 fest. Demnach sinkt mit nach hinten verschobener Zungenposition der
Wert von F2. Die gleiche Wirkung hat Lippenrundung auf F2. Durch
Verlängerung des Ansatzrohres im vorderen Bereich verschiebt sich die
Zungenposition relativ gesehen nach hinten, was zur Absenkung von F2 führt.
Die Sonagramme in Abbildung 3.2 zeigen die Auswirkung von a) Lippenrundung der
vorderen Vokale und b) Entrundung der hinteren Vokale auf den zweiten Formanten.
Lippenrundung bei beibehaltener Zungenposition und -höhe führt zur
Absenkung, Lippenspreizung bzw. eine neutrale Lippenstellung zur Anhebung von F2.
So hat das hohe, gespreizte /i/ den höchsten, das gerundete, hintere /u/ den
tiefsten zweiten Formanten.
Abb. 3.2a: Auswirkung von Lippen-Rundung auf F2 der vorderen Vokale [i e
Abb. 3.2b: Auswirkung von Lippen-Entrundung auf F2 der hinteren Vokale [u o]
F1 - Grad der artikulatorischen Öffnung
F2 - Länge der oralen Resonanzhöhle
Abb. 3.3: Vokalschema zur Verdeutlichung des engen Zusammenhangs zwischen
Akustik und Artikulation
Wir werden die Vokale im Sonagramm in einem ersten Analyseschritt immer in vordere und
hintere Vokale einteilen, da sich diese Gruppen am leichtesten voneinander
unterscheiden lassen.
Abb. 3.4: Die vorderen Vokale [i e
Abb. 3.5: Die hinteren Vokale [u o
"acute", "grave", "diffuse" und "compact" sind Merkmalsbezeichnungen, die den
"Distinctive Features" von JAKOBSON, FANT und HALLE (1969) entnommen sind.
Die mittleren zentralen Vokale [
Die Abbildung 3.6 zeigt Sonagramme der zentralen Vokale [
Abb. 3.6: Die zentralen Vokale [
Während Vokale sich eindeutig durch ihre Formantwerte voneinander
unterscheiden und Frikative relativ klar durch den Intensitätsschwerpunkt des
Friktionsgeräuschs gekennzeichnet sind, ist es besonders bei Nasalen und
Plosiven oft problematisch, ihre Artikulationsstelle zu bestimmen. In solchen
Fällen wird man versuchen, sich an den Transitionen, also den
Formantverläufen der angrenzenden Vokale zu orientieren.
Eine besondere Rolle spielt hierbei der zweite Formant, wie bereits POTTER, KOPP
und GREEN-KOPP (1966
Man denke sich dabei unsichtbare Formanten, deren Lage lediglich an den Grenzen zu
vokalischen Segmenten anhand ihrer Transitionen, d.h. ihrer artikulatorischen und
akustischen Übergänge, erkennbar wird. Diesen F2- 'hub' bezeichnen wir
nach DELATTRE, LIBERMAN und COOPER (1955) als Lokus eines Lautes.
Sie prägten diesen Begriff, als sie mit Hilfe der 'Pattern-Playback-Methode'
selbstgezeichnete Sonagramme wieder hörbar machten, um so verschiedene
Transitionsverläufe zur Perzeption von Plosiven zu testen. Sie definierten den
Lokus eines Plosivs als imaginären Punkt auf der Frequenzachse ca. 50 ms
vor der Verschlußlösung des Plosivs. Er wird als der virtuelle
Ausgangspunkt der F2-Transitionen von einem Plosiv zu den F2-Werten aller
möglichen folgenden Vokale betrachtet.
Aufgrund ihrer Synthese-Experimente kamen sie zu dem Schluß, daß der
Lokus von [b] bei 720 Hz, von [d] bei 1800 Hz und bei [g] in Kombination mit
vorderen Vokalen bei 3000 Hz liege. Vor hinteren Vokalen liege der Lokus des [g]
unter 1000 Hz. Sie glaubten, die artikulatorische Signifikanz dieser Loki sei
begründet durch die bei der Lautbildung invariante Vokaltrakt-Konfiguration.
ÖHMAN (1966) und FANT (1969) beobachteten jedoch eine zusätzliche
Abhängigkeit der Loki von den anliegenden Vokalen. Öhman stellte fest,
daß die Variabilität der Formanttransitionen in VC-Folgen kontrolliert
wird durch den folgenden Vokal. Da 'Spuren' des Folgevokals bereits in den
Transitionen vom Initialvokal zum Konsonanten zu sehen sind, muß geschlossen
werden, daß die Artikulationsbewegungen zum Folgevokal bereits zu Beginn der
Verschlußphase des Konsonanten einsetzen.
Die elegante, weil sehr einfache Lokus-Theorie läßt sich also in ihrer
ursprünglichen Form - leider - nicht mehr halten, da der Verlauf der
Plosivtransitionen, und ganz besonders auch ihr imaginärer Ausgangspunkt
während der Verschlußphase, sowohl vom vorausgehenden als auch vom
Folgevokal beeinflußt wird.
Vergleichen wir nun die Loki und Transitionen der Artikulationsmodi Plosiv, Nasal
und Frikativ bei jeweils gleicher Artikulationsstelle. Die Abbildung 3.7a zeigt die
Artikulationsstellen 'labial' und Abbildung 3.7b die Artikulationsstellen 'alveolar'
jeweils in Verbindung mit dem Zentralvokal /a/, also im symmetrischen Vokalkontext.
Abb. 3.7a: Der Lokus 'labial' in [abamava]
Der Vokal [a] zeigt bei allen drei Artikulationsmodi Plosiv [b], Nasal [m] und Frikativ
[v] der Artikulationsstelle 'labial' negative Transitionen.
Abb. 3.7b: Der Lokus 'alveolar' in [adanaza]
Bei der Artikulationsstelle 'alveolar' dagegen finden wir für F2 und F3 positive
Transitionen. Demnach scheint der 'labiale' Lokus niedriger als der F2 des [a] zu
liegen, der 'alveolare' Lokus aber oberhalb des zweiten Formanten von [a]. Wir
erkennen also recht gut die artikulationsstellen-bedingten akustischen
Gemeinsamkeiten bei Konsonanten verschiedener Artikulationsmodi bei gleicher
Artikulationsstelle.
Stark vereinfacht bezeichnen wir nun als Lokus bei labialen Konsonanten ein Wert von
etwa 700 Hz, bei alveolaren von etwa 1800 Hz und bei palatalen und velaren Werte
zwischen 2000 Hz und 3000 Hz.
Im Deutschen unterscheiden wir für die Plosive die Artikulationsstellen labial,
alveolar und velar. Die Artikulationsstelle 'velar' variiert zusätzlich in
Abhängigkeit des angrenzenden Vokals.
LABIAL:
Abb. 3.8: Der labiale Plosiv [bi be b
ALVEOLAR:
Abb. 3.9: Der alveolare Plosiv [di de d
VELAR:
Abb. 3.10: Der velare Plosiv [gi ge g
Transitionen lassen sich jedoch nur auswerten, wenn sie in ihrer Lage und Richtung
deutlich zu erkennen sind und wenn an den Plosiv mindestens ein vokalisches
Segment angrenzt. Bei aspirierten Plosiven kann dies zu Problemen führen,
besonders wenn die Aspiration eine niedrige Intensität aufweist. In diesem Fall
ist die für die Transition verantwortliche artikulatorische Bewegung
häufig schon abgeschlossen, bevor die Stimmbandschwingung wieder einsetzt.
Dies gilt bereits bei einer Aspirationsphase, die länger als 40 ms dauert. Eine
intensive Aspirationsphase jedoch kann sehr wohl deutliche Formantverläufe
aufweisen. In solchen Fällen wie auch bei Affrikaten geben uns
möglicherweise die Transitionen eines vorausgehenden Vokals zum Plosiv
Aufschluß über die Artikulationsstelle des Plosivs.
In Abbildung 3.11 deuten fallende Transitionen des vorausgehenden Vokals in der
Äußerung "heb" auf einen labialen Plosiv, die Transitionen der
Äußerungen "Matsch" und "Mut" dagegen auf einen Lokus in der Gegend
von etwa 1800 Hz und damit auf einen alveolaren Plosiv.
Abb. 3.11: heb, Matsch, Mut [hepH, mat
Bei der Beurteilung des Verlaufs einer Transition sind immer Ausgangs- und
Zielposition der artikulatorischen Bewegungen zu bedenken. Diese sind direkt von der
Plosivumgebung abhängig. Haben Vokal und Plosiv dieselbe Artikulationsstelle,
d.h. beide sind homorgan, ergeben sich nur geringfügige
Artikulationsbewegungen. Die Folge davon ist ein neutraler Transitionsverlauf des
zweiten Formanten. Ein solcher Fall ist bei [di], [ti], [gu] und [ku] gegeben.
Vergleichen wir dazu den Weg und die Lage der Zunge bei den Folgen [di] und [du] in
Abbildung 3.12. Die Transition des zweiten Formanten F2 verläuft bei der
homorganen Folge [di] neutral, während wir bei der Folge [du] einen fallenden
Verlauf von F2 feststellen. Die Zunge ist beim [d] bereits vorne angehoben, wie es die
[i]-Artikulation erfordert, während sie für die [u]- Artikulation vorne
gesenkt und hinten angehoben werden muß.
Abb. 3.12: neutrale vs. deutliche Transition in [di] vs. [du] , F2: bleibt gleich vs.
fällt.
Ein weiterer Aspekt ist die Tatsache, daß die Artikulatoren beim bilabialem
Plosiv und angrenzendem Vokal, nämlich Lippen und Zunge, voneinander
unabhängig sind, während beim alveolaren und velaren Plosiv nur die
Zunge jeweils Artikulator ist. Sie muß erst ihre Vokalstellung aufgeben, damit
der Verschluß gebildet werden kann. Und der Verschluß muß bereits
wieder gelöst worden sein, bevor die Vokaltransitionen beginnen können.
Für die bilabialen Plosive gilt das Gegenteil: die Zunge kann bereits
während der Verschlußphase die Vokalposition einnehmen. So kann im
stark koartikulierten Fall eine sichtbare Vokaltransition ganz fehlen, da der
artikulatorische Übergang bereits während der Verschlußphase
stattgefunden hat.
LABIAL:
ALVEOLAR:
VELAR:
Nachdem es jedoch meistens schwierig sein wird, die spektrale Zusammensetzung
eines derart kurzen Zeitraumes wie dem eines Bursts nur mit Hilfe des Sonagramms zu
bestimmen, scheint dieses Merkmal für den Sonagrammleser nur bedingt
nutzbar. Eine schwächere Burst-Intensität, wie sie bei stimmhaften
Plosiven üblich ist, kommt erschwerend hinzu.
LABIAL:
VELAR:
Die folgende Abbildung 3.13 zeigt Plosionsgeräusche aller drei
Artikulationsstellen: den schwachen bilabialen Burst, die unterbrochene Linie des
alveolaren Burst, sowie den klaren Burst-Schwerpunkt und die Mehrfachlösung
des velaren Plosivs.
Abb. 3.13: /p, t, k/ Plosiv-Bursts isoliert produziert.
LABIAL:
ALVEOLAR:
VELAR:
Grundsätzlich - und besonders bei stimmlos aspirierten Plosiven - orientieren
wir uns zusätzlich an den Transitionen des vorausgehenden Vokals zum Plosiv
hin. Die Erkennung von Plosiven in nicht vokalischer Umgebung (d.h. es grenzen
weder Vokal noch Nasal noch Lateral an) bereitet meist größere
Schwierigkeiten. Hier können uns lediglich Struktur und Intensität des
Bursts einen gewissen Hinweis geben. Möglicherweise wird uns auch
phonotaktisches Wissen über die Wahrscheinlichkeit oder gar
Möglichkeit, einen bestimmten Plosiv in der bereits erkannten Laut-Umgebung
anzutreffen, bei seiner Identifikation hilfreich sein.
Formanttransitionen beobachten wir lediglich bei Vokalübergängen, in
denen der Glottal-Stop zur Glottalisierung reduziert ist. Bei diesen durchgehend
glottalisierten Vokalübergängen verlaufen Transitionen vom einen zum
anderen Vokal in einer Phase von 'creaky voice'. Die Unterscheidung zwischen
Glottalisierung und glottalem Verschlußlaut wurde in Kapitel 2.3 beschrieben.
Die Sonagramme in Abbildung 3.14 zeigen eine Gegenüberstellung von Plosiv
und Glottal-Stop in Form von Minimalpaaren.
Abb. 3.14: Plosiv vs. Glottal-Stop in Minimalpaaren. "Banner, dumm, geben" vs.
"
Die obere Sonagramm-Reihe zeigt die Plosive [b, d, g] in den Äußerungen
"Banner, dumm, geben", wo wir die Merkmale 'stimmhafte Verschlußphase' und
'Transitionen zum Folgevokal' finden. Dagegen beobachten wir bei den mit Glottal-
Stop beginnenden Äußerungen "Anna, um, eben" der unteren Reihe einen
deutlichen Abstand zwischen Verschlußlösung und Vokalbeginn sowie
Burst-Schwerpunkte bei den Formantfrequenzen der Vokale.
Im folgenden Kapitel wird jeder Frikativ einzeln mit seinen typischen Eigenschaften
vorgestellt, ausgenommen die /r/-Realisationen [X,
Stimmhaft vs. stimmlos
Ein wichtiges Merkmal besonders zur Unterscheidung der hinteren
Artikulationsstellen ist neben den Transitionen die spektrale Zusammensetzung des
Frikativschalls, sein Schwerpunkt und seine Gesamtintensität. Das
Frikativspektrum wird - wie bereits in Kapitel II.7 beschrieben - durch die Passage des
frikativen Grundschalls von dem Ort der Engebildung bis zur Mundöffnung
geprägt. Je länger die Passage, desto tiefer sind die am Mund
abgestrahlten Frequenzen, bzw. ihr Gesamtschwerpunkt. Wir sprechen dabei von
'artikulatorischer Tiefe'
Das Sonagramm in Abbildung 3.15 zeigt Frikative der Artikulationsstellen alveolar,
postalveolar und glottal im Vergleich. Der Frequenzschwerpunkt sinkt mit
zunehmender artikulatorischer Tiefe.
Abb. 3.15: Frikative [sa
Das Sonagramm in Abbildung 3.16 zeigt Frikative der Artikulationsstellen labiodental,
palatal und velar im Vergleich. Mit zunehmender artikulatorischer Tiefe zeigt der
Frikativ stärkere Resonanzstrukturen.
Abb. 3.16: Frikative [fu çu xu]
Kommen wir nun zu einer systematischen Beschreibung der
Frikative. Begonnen wird mit der Artikulationsstelle der geringsten artikulatorischen
Tiefe.
5.1 Labiodental [f v]
Abb. 3.17: Die labiodentalen Frikative [f] und [v] jeweils im Vokalkontext [i a u]
Das stimmhafte [v] erkennt man häufig nur an 'voice bar', schwacher Energie
im obersten Frequenzbereich und den negativen Transitionen angrenzender Vokale.
5.2 Alveolar [s z]
Abb. 3.18: Die alveolaren Frikative [s] und [z] jeweils im Vokalkontext [i a u]
5.3 Postalveolar [
Abb. 3.19: Die postalveolaren Frikative [
5.4 Palatal [ç j]
Abb. 3.20: Die palatalen Frikative [ç] und [j] jeweils im Vokalkontext [i a u]
5.5 Velar [x]
Die Artikulationsstelle des velaren Frikativs kann sich nach hinten bis zur
Artikulationsstelle uvular [X] verschieben. Das beobachten wir vor allem vor hinteren
tiefen Vokalen wie [a] oder [
Zur Unterscheidung von [x] und [ç] kann im Deutschen der vokalische Kontext
hinzugenommen werden, der entscheidet, welches /ch/-Allophon produziert wird, da
beide distributive Allophone des Phonems /ch/ sind. So taucht das [x] niemals nach
vorderen Vokalen oder initial auf. Das [ç] dagegen kann sowohl initial als auch
im Diminuitivsuffix "-chen" nach jedem Vokal auftreten.
Abbildung 3.21 zeigt das [x] in den Äußerungen "doch", "Dach" und
"Tuch".
Abb. 3.21: Der velare Frikativ [x] in den Äußerungen "doch", "Dach" und
"Tuch".
5.6 Glottal [h< ipa147>]
Abb. 3.22: Der glottale Frikativ /h/ im symmetrischen Vokalkontext [ihi] und [aha].
Abb. 3.23: Vokaltransition durch das /h/ in [iha]
Das /h/ steht im Deutschen nur vor Vokal und im Morphemanlaut. Es kann sowohl
stimmhaft als auch stimmlos realisiert werden. Untersuchungsergebnisse von STOCK
(1971
Der glottale Frikativ entspricht akustisch prinzipiell dem Aspirationsgeräusch
nach stimmlosen Plosiven. Nach BLUHME (1965
5.7 Zusammenfassung
Abb. 3.24: [i
Mit zunehmender artikulatorischer Tiefe weist der Frikativ auch zunehmend
formantähnliche Strukturen auf. Das gilt insbesondere für die Frikaive
[ç], [x] und [h]. Um sie anhand ihrer Position (Stellung) innerhalb einer
Äußerung unterscheiden zu können, gibt folgende Tabelle eine
vergleichende Übersicht, in welchen Positionen sie jeweils im
Standarddeutschen vorkommen können.
Die Artikulationsstellen reichen von alveolar [r,
Das ist auch der Grund dafür, warum dieses Kapitel im Vergleich zu den
anderen Kapiteln anders aufgebaut ist. Wurden die Laute bisher im Rahmen ihrer
Lautklasse, geordnet nach ihrem Artikulationsmodus, vorgestellt, werden hier die
möglichen Allophone eines Lautes präsentiert, obwohl sie verschiedene
Artikulationsmodi haben und damit unterschiedlichen Lautklassen angehören.
Die Beschreibung der /r/-Allophone wird im Folgenden gruppiert nach ihrer
Artikulationsstelle vorgenommen.
6.1 Uvularer Trill, Frikativ, Glide
Nach KRÄMER (1979
Das [
Die Sonagramme in Abbildung 3.25 zeigen das [RR] mit konvergierendem F3/F4 in den
Äußerungen "Bahre", "Grat", "verrät" und "ruht".
Abb. 3.25: Beim [
Eine zunehmende Entfernung zwischen F3 und F4 zeigt den abnehmenden Grad
artikulatorischer Enge an. Gleichzeitig läßt sich eine Abnahme der
Gesamtintensität des Signals beobachten
Abb. 3.26a: Das [
Gelegentlich finden wir eine teils stimmhafte Realisation, die im zweiten Teil
stimmlos wird, wie im Beispiel "brat" in Abbildung 3.26b zu sehen ist.
Abb. 3.26b: Das [
Das uvulare r-Allophon [
Abb. 3.27: Der uvulare Approximant (Glide) in "verruht".
6.2 Alveolarer Trill und Glide
Die Intermissionsfrequenz der beiden Trills [r,R], d.h. die Frequenz ihrer Phasen
maximalen Verschlusses, liegt bei 23-26 Hz.
Abb. 3.28: Der alveolare [r] und der uvulare [R] Trill [r] im Vergleich (isoliert produziert).
Da die Realisierung des /r/ als alveolarer Glide [
TRANSITIONEN
PLOSIVE
FRIKATIVE
/r/
Er schloß, "es gibt einen direkten Zusammenhang zwischen dem Ansteigen des
ersten Formanten und dem Öffnungsgrad des Oraltraktes: Je kleiner der Grad
der artikulatorischen Öffnung, desto tiefer die Frequenz des F1 und
umgekehrt." Den Grad der artikulatorischen Öffnung definierte er als Distanz
"zwischen dem höchsten Punkt der Zunge und den am nächsten
gelegenen Punkt des Palatums", also der engsten Stelle zwischen Zunge und Gaumen
Die Länge der oralen Resonanzhöhle definierte er als den Grad der
Zurückgezogen- und Angehobenheit der Zunge und den Grad der
Lippenrundung. Je weiter hinten angehoben und damit zurückgezogen die
Zunge ist, desto länger wird die Mundhöhle. Ihre Länge
vergrößert sich ebenfalls mit zunehmender Lippenvorstülpung,
sprich -rundung. So sinkt mit zunehmender Länge der oralen
Resonanzhöhle der zweite Formant.
1.1 Vordere Vokale
Das Sonagramm in Abbildung 3.4 zeigt die Folge vorderer ungerundeter Vokale [i e
1.2 Hintere Vokale
Kennzeichen der hinteren Vokale ist a) ein sehr enges Zusammenliegen der ersten
beiden Formanten b) im unteren Frequenzbereich bis ungefähr 1000 Hz,
weswegen man sie als a) "compact" und b) "grave" (schwer, dumpf) bezeichnet. Beide
Formanten F1 und F2 liegen oft so eng zusammen, daß sie aufgrund ihrer
Bandbreiten nicht mehr voneinander zu unterscheiden sind. Wie die Folge hinterer
Vokale in Abbildung 3.5 zeigt, verändert sich der Abstand zwischen den beiden
Formanten nur geringfügig mit der Zungenhöhe.
Allerdings steigen beide Formanten mit abnehmender Zungenhöhe an. Nicht
eigentlich in die Reihe der hinteren Vokale gehörend ist das hier produzierte,
zentrale /a/. Seine Formantwerte liegen nicht "compact" im unteren, sondern im
mittleren Frequenzbereich um 1000 Hz.
1.3 Zentrale Vokale
Die Formanten des neutralen Schwa sind äquidistant, ihre Abstände
liegen bei etwa 1000 Hz. Das gilt sowohl für den Abstand zwischen F1/F2 als
auch zwischen F2/F3. Im Vergleich dazu liegen F2 und F3 bei den vorderen Vokalen
meist sehr eng zusammen, wohingegen sie bei den hinteren weit auseinander liegen.
Eine gewisse Äquidistanz ist das Kennzeichen aller Zentralvokale [
Diese Werte dürfen jedoch lediglich als grobe
Orientierungshilfe verstanden werden und bedürfen besonders bei der
Artikulationstelle 'velar' eines Kommentars. Denn diese Artikulationsstelle variiert
sowohl bei Plosiven wie auch bei Frikativen nicht unerheblich in Abhängigkeit
von den angrenzenden Vokalen. Weitgehend bekannt ist dies bei den Plosiven [k, g],
doch auch beim Frikativ [x] wurde dieses Phänomen beobachtet. Darauf werden
wir in den folgenden Kapiteln noch näher eingehen.
3.1 Diskrimination anhand der Loki bzw. der Formanttransitionen
Dieses Merkmal bietet sich nur bei Plosiven in vokalischer Umgebung an. Zur
Orientierung seien nochmals die Lokus-Werte von DELATTRE, LIBERMAN und
COOPER (1955) genannt:
labial: bei 720 Hz,
alveolar: bei 1800 Hz,
velar: bei 3000 Hz in Kombination mit vorderen Vokalen,
unter 1000 Hz vor hinteren Vokalen.
Auch wenn die Lokus-Theorie in ihrer ursprünglichen Form nicht mehr gilt,
kann uns der Verlauf der Transitionen vom Vokal zum Plosiv und vom Plosiv zum
Vokal doch wichtige Aufschlüsse über die Artikulationsstelle geben.
Fallen F1, F2 und F3 zum Plosiv hin (negative Transitionen), ist das ein klares Indiz
für einen bilabialen Plosiv, unabhängig vom Vokalkontext. Das
Sonagramm in Abbildung 3.8 zeigt die fallenden Transitionen vom [b] zu den
Folgevokalen [i e
Verlaufen F2 und F3 quasi parallel vor einem nicht-hinteren Vokal, d.h. sie sind beide
steigend, fallend oder waagerecht, deutet das auf einen alveolaren Plosiv. Scheinen
sich F2, F3 und F4 zu Beginn eines folgenden hinteren Vokals in einem Punkt bei
etwa 2500 Hz zu treffen, ist das ebenfalls ein klarer Hinweis auf einen alveolaren
Plosiv. Das Sonagramm in Abbildung 3.9 zeigt die Transitionen vom [d] zu den
Folgevokalen [i e
Ein Zusammenlaufen von F2 und F3 ist dagegen bei nicht-hinteren Vokalen ein
Hinweis auf einen velaren Plosiv. Folgt einem velaren Plosiv ein hinterer Vokal, sind
aufgrund des tiefen Lokus für die hintere Version von [g, k] keine Transitionen
erkennbar. Das Sonagramm in Abbildung 3.10 zeigt die Transitionen vom [g] zu den
Folgevokalen [i e 3.2 Diskrimination anhand der Transitionsdauer
Die verschlußbildenden Artikulatoren (Lippen, Zungenspitze und
Zungenrücken) sind nicht gleich gut beweglich. Sie bewegen sich mit
unterschiedlichen Geschwindigkeiten, wobei die Zungenspitze die schnellsten
Bewegungen vollführt. Demzufolge wird ein apikaler Verschluß schneller
gebildet als ein velarer. Grundsätzlich ist jedoch neben der Beweglichkeit der
Artikulatoren auch der Grad der 'artikulatorischen Nähe' zweier benachbarter
Laute, was ihre Artikulationsstelle betrifft, verantwortlich für die Dauer der
Transition.
3.3 Diskrimination anhand der Burst-Frequenz bzw. des Burst-Spektrums
Bei Untersuchungen zur spektralen Zusammensetzung des
Verschlußlösungsgeräusches, dem Burst, fanden HALLE, HUGHES
und RADLEY (1957) signifikante Unterschiede bei allen Plosiven. Danach
läßt sich die Artikulationsstelle eines Plosivs am Spektrum seines Bursts
zweifelsfrei erkennen.
Eine Energiekonzentration im unteren Frequenzbereich zwischen 500 Hz und 1000 Hz
zeigt einen bilabialen Plosiv an.
Ist das Spektrum flach oder dominiert im oberen Frequenzbereich über 4000 Hz,
handelt es sich um einen alveolaren Plosiv. Zusätzlich gibt es eine
Energiekonzentration bei 500 Hz. Der alveolare Burst weist häufig eine
unterbrochene Struktur auf, was ihm das Aussehen einer 'gestrichelten Linie' verleiht.
Eine hohe Energiekonzentration im mittleren Frequenzbereich zwischen 1500 Hz und
4000 Hz kennzeichnet den velaren Plosiv. In der Regel findet sich eine
punktförmige Energiekonzentration von bis zu 500 Hz Bandbreite im
Sonagramm. Die Lage des Schwerpunkts hängt vom folgenden Vokal ab. Er
liegt vor den vorderen, ungerundeten Vokalen [i I e 3.4 Diskrimination anhand der Burst-Intensität
Der Zusammenhang zwischen Artikulationsstelle und Intensität des Bursts
läßt sich folgendermaßen darstellen. Je größer der orale
Resonanzraum, d.h. der Mundraum, in dem der Plosionslärm entsteht, desto
ausgeprägter ist das Plosionsgeräusch.
Das bedeutet konkret für den bilabialen Plosiv die schwächste Burst-
Intensität und auch das kürzeste
Verschlußlösungsgeräusch.
Eine längere Plosionsdauer mit intensiverem Burst finden wir bei velaren
Plosiven. Aufgrund der breiten Verschlußfläche des Zungenrückens
können dort mehrere Verschlußlösungen nacheinander auftreten -
ein typisches Merkmal velarer Plosive.
Labial [p]: schwach,
Alveolar [t]: gestrichelt,
Velar [k]: Burst-Schwerpunkt,
Velar [k]: Mehrfachlösung und Burst-Schwerpunkt bei ca. 2300 Hz.
3.5 Zusammenfassung
Anhand welchen Merkmals wir die Artikulationsstelle eines Plosivs bestimmen,
hängt von der jeweiligen Ausprägung der Merkmale ab.
Ein labialer Plosiv zeichnet sich durch negative Transitionen der ersten drei
Formanten F1 bis F3 aus. Bei angrenzenden Vokalen mit hohem F2 verlaufen diese
Transitionen sogar sehr steil, sofern der überwiegende Teil des artikulatorischen
Übergangs nicht bereits während der Verschlußphase stattgefunden
hat. Der Burst ist häufig nur sehr schwach ausgeprägt mit einer
Energiekonzentration im unteren Frequenzbereich.
Um einen alveolaren Plosiv zu identifizieren, orientieren wir uns zum einen an seinem
Lokus bei etwa 1800 Hz, von dem die Transitionen meist ausgehen. Um jede
Verwechslung mit dem variablen, velaren Plosiv auszuschließen, achten wir
zusätzlich auf den Burst, der bei alveolaren Plosiven häufig eine
unterbrochene Struktur und keine Mehrfachlösungen aufweist. Konvergieren F2
und F3 vor einem hinteren Vokal, spricht das ebenfalls für einen alveolaren
Plosiv.
Einen velaren Plosiv erkennen wir meist sehr gut an der
Mehrfachverschlußlösung und einer zentralen Burst- Frequenz zwischen
1000 Hz und 3500 Hz. Auch konvergierender F2 und F3 sind ein
verläßliches Erkennungszeichen, sofern der Plosiv nicht an einen
hinteren, sondern an einen vorderen oder mittleren Vokal angrenzt.
Grundsätzlich sind stimmhafte von stimmlosen Frikativen abzugrenzen.
Abgesehen von dem 'voice bar' zeichnen sich stimmhafte Frikative durch eine
geringere Intensität und meist kürzere Dauer als die stimmlosen
Versionen aus. Bei stimmhaften Frikativen sind zuweilen Formantstrukturen gut zu
erkennen. Auch Transitionen sind in vokalischer Umgebung besonders an den
Grenzen stimmhafter Frikative deutlich ausgeprägt.
Das Spektrum labiodentaler Frikative ist flach. Ihre Energie ist
gleichmäßig über alle Frequenzbereiche verteilt mit einer leichten
Energiekonzentration im obersten Frequenzbereich oberhalb von 6000 Hz. [f] und [v]
sind - besonders im Vergleich zu [s] und [
Das Spektrum der alveolaren Frikative weist insgesamt eine sehr hohe Intensität
auf. Es gibt eine Energiekonzentration im Bereich von 5000 Hz bis 8000 Hz. Die
Untergrenze des Energieschwerpunktes kann bei angrenzenden hinteren Vokalen um
bis zu 1000 Hz tiefer liegen. Die Abbildung 3.18 zeigt den stimmlosen und stimmhaften
alveolaren Frikativ in verschiedenen Vokalkontexten.
Postalveolare Frikative weisen im Zeitsignal die stärkste Energie, d.h. die
höchste Amplitude auf. Dadurch weisen sie im Sonagramm einen sehr hohen
Schwärzungsgrad auf. Ihr Energieschwerpunkt liegt im Bereich von 2500 Hz bis
7000 Hz. Damit liegt ihr Schwerpunkt um bis zu 2500 Hz tiefer als bei den alveolaren
Frikativen. Die Schwerpunktsuntergrenze variiert ebenfalls je nach angrenzendem
Vokal. Abbildung 3.19 zeigt den stimmlosen und stimmhaften postalveolaren Frikativ in
verschiedenen Vokalkontexten.
Palatale Frikative sind wesentlich intensitätsschwächer als alveolare oder
postalveolare. Ihr Frequenzschwerpunkt reicht hinunter bis ca. 3000 Hz und kann
bereits formantähnliche Strukturen aufweisen. Damit liegt ihre
Schwerpunktuntergrenze über der der postalveolaren Frikative.
Dieses Faktum widerspricht dennoch nicht dem Gesetz der artikulatorischen Tiefe, da
sich beim postalveolaren Frikativ [
Abbildung 3.20 zeigt den stimmlosen und stimmhaften palatalen Frikativ in
verschiedenen Vokalkontexten. Die besonders beim stimmhaften [j] schon erkennbaren
formantähnlichen Strukturen erinnern an den Vokal [i].
Der velare Frikativ [x] zeichnet sich durch Friktionsenergie bis in die untersten
Frequenzbereiche aus und läßt sich dadurch vom palatalen [ç]
unterscheiden. Sein Spektrum weist eine relativ gut ausgeprägte
formantähnliche Struktur auf. Sie variiert zwar in Abhängigkeit von den
angrenzenden Vokalen, entspricht aber nicht - anders als beim glottalen /h/ - deren
Formantstruktur.
Der glottale Frikativ ist ein stark koartikulierter Laut. Dennoch kann man - entgegen
früherer Annahmen - nicht von einem dem Folgevokal entsprechenden
geflüsterten Laut sprechen
Das Sonagramm in Abbildung 3.23 zeigt die Vokaltransitionen vom [i] zum [a], die
über die gesamte Dauer durch das /h/ verlaufen.
Dauer des /h/ Durchschnitt Bereich
in stimmhafter Umgebung 74 ms 30-150 ms
nach stimmlosem Segment 52 ms 20-100 ms
initial 42 ms 20-80 ms
Wir können zusammenfassend sagen, daß die untere Frequenzgrenze (d.h.
die Untergrenze des frikativen Frequenzschwerpunktes) des im Sonagramm sichtbaren
Rauschens mit zunehmender artikulatorischer Tiefe sinkt. Gleichzeitig
beeinflußt die vokalische Umgebung diese Untergrenze. Ein hoher F2 des
angrenzenden Vokals führt zu einer leichten Anhebung, ein tiefer F2 zur
Absenkung dieser Grenze. So kann sie bei vorderen Vokalen zwischen 500 Hz und
1000 Hz höher liegen als bei hinteren Vokalen. Besonders deutlich wird dies,
wenn Vokale unterschiedlicher Qualität angrenzen. Dann steigt oder fällt
die Untergrenze im Verlauf des Frikativs von einem Vokal zum anderen. Das
Sonagramm in Abbildung 3.24 zeigt dies am Beispiel vom [i] mit hohem F2 zum [u] mit
tiefem F2 in der Äußerung "Mischung".
Position [ç] [x] [h]
initial ja nein ja
final ja ja nein
nach vorderen Vokalen ja nein ja
nach hinteren Vokalen ja ja ja
(Diminuitiv: -chen)
vor Konsonanten (Kompo-
sita ausgenommen) ja ja nein
Die beiden postdorsal-uvularen Allophone [R] und [
Der alveolare Trill [r] ist vom uvularen Trill [R] anhand zweier Merkmale zu
unterscheiden.
Die Zunge wird dabei nach oben zurückgebogen, so daß die Unterseite der
Zungenspitze mit den Alveolen eine Enge bildet. Im Sonagramm ähnelt der
Glide einem hinteren Vokal. Formanten der angrenzenden Vokale scheinen - wie
bereits beim uvularen Approximanten beschrieben - zum [
VOKALE
Antworten
Weiter zu KAPITEL IV
Diese und alle weiteren hier referenzierten Seiten mit der Initiale 'SGL'
im Filenamen
dürfen kopiert, gedruckt und an Dritte weitergegeben werden,
unter der Bedingung, daß jede Seite vollständig bleibt.
Weitergabe von Auszügen nur mit Erlaubnis der Urheber.
Kirsten Machelett
kirsten@phonetik.uni-muenchen.de