Akustische Phonetik - Kapitel II
Was ist Sprachschall?

Prof. H.G. Tillmann, Dr.-Ing. F. Schiel

Inhalt:

  1. Einleitende Bemerkungen
  2. Die Quelle-Filter Theorie
  3. Artikulation von Vokoiden
  4. Sekundäre Schallerzeugung
  5. Ankopplung des Nasenraums
  6. Beispiele Formanttransitionen
  7. Fragen


  1. Einleitende Bemerkungen
  2. In Kapitel I haben wir uns mit dem Begriff Schall als hörbares, physikalisches Ereignis beschäftigt. In diesem Kapitel wollen wir uns weiter einschränken und uns nur noch mit akustischen Signalen befassen, wie sie ein menschlicher Artikulationstrakt erzeugt.

    In den folgenden Kapiteln werden wir uns daher mit den Grundtypen der Sprachschallerzeugung und deren akustische Auswirkungen beschäftigen.

    Wenn wir auch dabei die verschiedenen Arten der Anregung streng trennen, darf nicht vergessen werden, daß die meisten der nachfolgend beschriebenen Mechanismen parallel ablaufen können. So kann z.B. ein Frikativ durchaus von einem stimmhaften Signal der Glottis begleitet sein (z.B. in 'Garage'); man spricht dann eben auch von einem stimmhaften Frikativ, usw.

  3. Die Quelle/Filter Theorie
  4. Nach Fant (1960) kann man sich die Sprachschall-Erzeugung aus zwei Teilmechanismen zusammengesetzt denken: die Rohschallerzeugung (Quelle) und einen nachgeschalteten Resonator (Filter).

    Die Quelle erzeugt ein Schallsignal mit einem bestimmten Spektrum, das bis zur Abstrahlung an den Lippen einen Resonator (den Vokaltrakt) durchläuft, welcher das Signal mit einer bestimmten Übertragungsfunktion verformt. Da es sich auch hier um ein lineares System handelt, kann man das Spektrum des abgestrahlten Sprachsignals dadurch erhalten, daß man das Spektrum der Quelle mit der Übertragungsfunktion des Filters multipliziert. Ein anderer - aber mathematisch äquivalenter - Weg ist die Faltung des Quellesignals mit der Impulsantwort des Filters im Zeitbereich.

    Dabei ist zu beachten, daß es sich bei der Quelle nicht nur um die stimmhaft angeregte Glottis handeln muß. Ebenso kann der Resonator, der Hohlraum im Vokaltrakt, je nach Lage der Quelle sehr komplexe Formen annehmen (z.B. bei Ankopplung des Nasenraums).

    Da es sich bei der Rohschallerzeugung, also der Quelle, immer um einen aerodynamischen Prozeß und bei der Verformung des Spektrums, also des Filters, immer um einen akustischen Prozeß handelt, wollen wir bei der nachfolgenden Beschreibung der verschiedenen Möglichkeiten zur Sprachlaut-Erzeugung diese beiden Aspekte immer getrennt ansprechen.

  5. Artikulation von Vokoiden - Primärschallerzeugung
  6. In diesem Abschnitt soll es um die Erzeugung von Sprachlauten gehen, bei denen der Vokaltrakt eine freie Passage darstellt (keine Engstellen) und die Glottis schwingt (Phonation). Um von dem mehr phonologisch orientiertem Begriff des Vokals deutlich zu unterscheiden, wenn man von den tatsächlichen Lauten spricht, hat Pike den Begriff Vokoide geprägt. Entsprechend gibt es den Begriff Kontoide für konsonantische Laute.

    Vokoidspektrum

    Ein typisches Vokoidspektrum läßt sich als
    harmonisches Linienspektrum darstellen, indem man eine Grundperiode aus dem gemessenen Sprachsignal herausschneidet und als Fourier-Reihe entwickelt.

    Wie man sieht, ist das Signal s(t) einerseits quasistationär mit der Grundfrequenz F0 (bei Männern typischerweise 90 - 140 Hz; bei Frauen zwischen 130 - 250 Hz), andererseits zeigen sich in den beiden Maxima im Amplitudenspektrum |S| die beiden ersten Formanten F1 und F2.

    Die Frage nach den Formanten

    Helmholtz (1862) und vor allem Stumpf (1926) vertraten die Auffassung, daß die Formanten einfach Harmonische der Grundfrequenz seien. Das impliziert aber, daß die Formanten im Vokalspektrum immer genau harmonisch zu liegen kommen, auch bei unterschiedlicher Grundfrequenz.

    Was aber, wenn die Harmonischen in Spektrum sehr weit auseinander liegen, z.B. aufgrund einer sehr hohen Grundfrequenz, wie in einer Kinderstimme oder beim Fisteln? Liegen dann die Formanten immer noch genau auf den Harmonischen? Oder vielleicht irgendwo dazwischen?

    Hermann (1890) war anderer Ansicht als Helmholtz: Er vertrat die These, daß die Formantfrequenzen durch eine Resonanz des Vokaltrakts, gleichsam einer angeschlagenen Glocke, hervorgerufen werden. Das Bild von der Glocke ist nicht von ungefähr gewählt: Auch bei einer Glocke liegen die Resonanzfrequenzen nicht harmonisch; genauso, wie man es auch bei den Formantfrequenzen beobachten kann.

    Eine annähernde Vorstellung, wie ein Sprachsignal nach Hermanns Theorie klingen würde, geben die Experimente des MIT der sog. Sine Wave Synthesis wieder.
    In diesen Experimenten wurden die Verläufe der ersten drei Formanten in aufgezeichneten Sprachsignalen analysiert und anschließend drei Sinus-Generatoren (die 'Resonanzen der Glocke') so gesteuert, daß sie genau diese Verläufe über der Zeit nachbildeten ( Sine Wave Replication).

    Orginal Aufzeichnung

    Sine Wave Synthesis

    Wie man unschwer hören kann, ist dies zwar immer noch verständlich, aber gewiß nicht die orginale Stimme.

    Wie wir im Laufe dieses Kapitels sehen werden, haben beide recht und unrecht. Zunächst aber wollen wir die beiden Aspekte der Schallerzeugung, den aerodynamischen und den akustischen, für die Vokoide näher betrachten.

    Aerodynamisches Modell der Phonation

    Auf die physiologischen Einzelheiten des Vokaltrakts und der daran beteiligten Organe kann hier nicht näher eingegangen werden. Siehe dazu das entsprechende Dokument zur Physiologie.

    Bei der stimmhaften Phonation bildet sich unterhalb der geschlossenen Stimmlippen ein Überdruck, welcher den Verschluß schließlich sprengt und einen Luftstrom durch die geöffneten Stimmlippen presst. Die Druckdifferenz ober- und unterhalb der Glottis wird damit schlagartig ausgeglichen. Die an den gewölbten Stimmlippen vorbeiströmende Luft erzeugt einen Unterdruck - ähnlich dem Unterdruck, der ein Flugzeug in der Luft hält (Bernoulli-Kraft) -, der die Stimmlippen wieder zusammenpresst. Der Druck unterhalb der Glottis baut sich wieder auf und der Zyklus beginnt von neuem.

    Als Resultat dieses Vorgangs entsteht an der Glottis eine periodische Druckschwankung, die sich akustisch (d.h. als Schallwelle) durch den weiteren Vokaltrakt fortpflanzt.

    Nach Pompino-Marschall (1995), Einführung in die Phonetik, S.34.

    Akustisches Modell des Vokaltrakts

    Der menschliche Vokaltrakt von der Glottis bis zur Mundöffnung kann bei der Vokalerzeugung (keine Verengung) in erster Näherung als Rohr mit schallharten (d.h. vollständig reflektierenden) Wänden, als sogenanntes Ansatzrohr betrachtet werden. Am geschlossenen Ende sitzt als Schalldruckquelle die Glottis; am anderen Ende ist das Rohr offen zur Mundöffnung.

    Nach Ungeheuer (1962) ist die Form des Querschnitts akustisch nicht relevant; lediglich die Querschnittsfläche ist entscheidend. Daher stellen wir uns ein Rohr mit kreisrundem Querschnitt vor.

    Die (idealerweise punktförmige) Glottis erzeugt eine (idealerweise) kugelförmig sich ausbreitende Schalldruckwelle. Diese wird an den schallharten Wänden des Rohres reflektiert und die Reflexionen überlagern sich - da es sich um ein lineares System handelt - additiv.
    Durch Anwendung der Websterschen Horngleichung läßt sich zeigen, daß sich innerhalb des Rohres stehende Wellen bei bestimmten Resonanzfrequenzen, eben den Formanten, ausbilden.

    Eine stehende Welle ist nichts anderes als eine Schallwelle, die die spezifische Geometrie ihrer Umgebung als Randbedingungen erfüllt und daher in dieser Geometrie eine Resonanzwelle bildet. Oder, mit anderen Worten: Eine stehende Welle ist die Schallwelle, deren Schalldruckverlauf zu einem festen Zeitpunkt t entlang einer bestimmten Strecke die geometrischen Randbedingungen einer gegebenen Geometrie erfüllt. In Kapitel I haben wir gelernt, daß Schallwellen Druckschwankungen im Medium Luft sind, die sich mit einer bestimmten Geschwindigkeit c (ca. 340 m/s) ausbreiten. Betrachtet man eine solche Schallwelle zu einem festen Zeitpunkt, d.h. friert man quasi die Bewegung der Wellenfront ein, so ist die Entfernung von einem Druckmaximum zum nächsten die Wellenlänge Lambda definiert als c geteilt durch f. Nun kann es vorkommen, daß durch äußere Einflüsse der Ort eines Druckmaximums oder -minimums festgehalten wird. Das bedeutet, die Welle kann sich nicht mehr als Ganzes fortbewegen, sie 'tritt quasi auf der Stelle'. In diesem Fall spricht man sinngerecht von einer stehenden Welle; physikalisch ist dies nur durch Reflexionen an festen Körpern zu erklären.

    Geometrische oder physikalische Randbedingungen für Schallwellen sind im Ansatzrohr die Mundöffnung (Druckminimum = 'Schwingungsknoten'), die Glottis (Druckmaximum = 'Schwingungsbauch') und die reflektierenden Wände.

    Voraussetzung für diese Modellvorstellung ist allerdings, daß der Rohrquerschnitt klein gegen die Wellenlänge der höchsten vorkommenden Frequenz ist. Andernfalls könnten sich stehende Wellen auch quer zum Rohrverlauf ausbilden, was die mathematische Behandlung verkomplizieren würde.

    Analogie zur schwingenden Saite:

    Eine Guitarrensaite hat eine bestimmte Länge und ist an beiden Seiten fest eingespannt. Wenn man sie anschlägt, kann sie an den Stellen, wo sie eingespannt ist, nicht schwingen. Die Randbedingung für die Auslenkung der Saite ist also: 'Schwingungsknoten' an beiden Enden.
    Damit ergeben sich nur die folgenden möglichen Resonanzschwingungen im System 'Guitarre': Eine Halbschwingung zwischen den beiden Schwingungsknoten, eine Vollschwingung zwischen den beiden Schwingungsknoten (also ein weiterer Knoten genau in der Mitte), eineinhalb Vollschwingungen zwischen den beiden Schwingungsknoten (also zwei weitere Knoten bei 1/3 und 2/3 der Saitenlänge), usf.
    Es entsteht eine Obertonreihe, d.h. ganzzahlige Vielfache der ersten Schwingung, und somit ein Klang.
    Beweis: Durch Anlegen des Fingers auf den 7. Bund (1/3 der Saitenlänge) bringt man eine weitere Randbedingung in das System: ein Schwingungsknoten an dieser Stelle.
    Dadurch lassen sich die Grundschwingung und der erste Oberton dämpfen (da diese hier keinen Schwingungsknoten haben). Man hört also nur noch den zweiten Oberton und weitere Obertöne, die an dieser Stelle einen Schwingungsknoten haben.

    VORSICHT: Es handelt sich hier nur um eine analoge Betrachtung! Der Vokaltrakt ist kein tonerzeugendes System wie eine Guitarrensaite, sonst hätte Hermann mit seiner Erklärung der Formanten als Schwingungen einer Glocke recht!

    Beispielrechnung für das glatte Ansatzrohr:

    Unser Ansatzrohr sei 17 cm lang und habe einen gleichmäßigen Querschnitt von 2 cm.

    Kontrolle der Wellenlänge in Querrichtung:
    Die Schallgeschwindigkeit c ist etwa 34000 cm/s. Nehmen wir als höchste, mögliche Frequenz in der Sprache 4000 Hz, dann ist die Wellenlänge Lambda gleich 8.5 cm, also noch groß gegen den Querschnitt von 2 cm.

    Stehende Wellen:
    Betrachten wir nun anschaulich, was für mögliche stehende Wellen in die Geometrie des Ansatzrohres passen. Der Schalldruck an der Glottis soll maximal, an der Mundöffnung minimal sein. Die erste mögliche, harmonische Schwingung, die diese Bedingung erfüllt, ist eine Cosinus-Welle einer Viertel Wellenlänge (also Pi/2).

    Ein Viertel der Wellenlänge dieser stehenden Welle ist 17 cm. Also ist die gesamte Wellenlänge Lambda 4 * 17 = 68 cm. Das entspricht der Frequenz

    f = c : Lambda = 34000 cm/s : 68 cm = 500 Hz

    Die erste Resonanzfrequenz unseres Rohres, und damit der erste Formant liegt also bei 500 Hz.

    Die nächste mögliche stehende Welle ist eine Cosinus-Welle mit Dreiviertel der Wellenlänge (also 3/2 Pi). Auch diese Welle erfüllt die Randbedingungen 'Bauch an der Glottis' und 'Knoten an der Mundöffnung', wie unschwer zu sehen ist.

    Damit ergibt sich eine Wellenlänge Lambda von 4/3 * 17 = 22.66 cm. Die entsprechende Resonanz-Frequenz berechnet sich zu

    f = c : Lambda = 34000 cm/s : 22.66 cm = 1500 Hz

    Die zweite Resonanzfrequenz unseres Rohres, und damit der zweite Formant liegt also bei 1500 Hz.

    Wir können dies nun für alle Frequenzen innerhalb der Hörfläche fortsetzen und erhalten die folgenden Formantlagen:

    Dies sind die Formantlagen des neutralen Schwa-Lauts, der genau dadurch gekennzeichnet ist, daß der Vokaltrakt über die ganze Länge einen ungefähr gleichmäßigen Querschnittsverlauf hat.

    Formanten

    Formanten sind also das Produkt von Resonanzen im Ansatzrohr. Die Luftsäule im Ansatzrohr wird durch das Glottissignal angeregt, an den durch die Geometrie vorbestimmten Frequenzen 'mitzuschwingen'. Dadurch verformt sich das gleichmäßig abfallende Glottisspektrum zu Gipfeln, die wir als die typischen Formanten für bestimmte Laute erkennen.

    Helmholtz und Hermann hatten also beide nur einen Teil der Wahrheit erkannt: Formanten sind nicht die Obertöne (Helmholtz), aber ohne die Obertöne im Glottisspektrum wäre auch keine Resonanz möglich (Ohne Anregung keine Resonanz!). Formanten sind keine Eigenschwingungen wie bei einer angeschlagenen Glocke (Hermann), aber wie bei einer Glocke werden die Formanten durch die Resonanzfähigkeit des Ansatzrohres und damit durch die Geometrie entscheidend bestimmt.

    Fant hat mit seiner Modellvorstellung von Quelle und Filter korrekt erkannt, daß der Vokaltrakt nichts anderes als ein lineares, akustisches Filter darstellt, dessen Übertragungsfunktion von der jeweiligen Stellung der Artikulationsorgane abhängt.

    Formantverschieber

    Meyer-Eppler und Ungeheuer (1962) haben mit Hilfe dieser Modellvorstellung als erste vorgeschlagen, die Formantlagen der verschiedenen Vokoide durch geometrische Abweichungen vom neutralen Ansatzrohr zu modellieren. Diese Abweichungen sind Erweiterungen und Verengungen des Ansatzrohres in bestimmten Bereichen des Vokaltrakts, wobei nur der Verlauf der Querschnittsfläche Sigma(z) die Lage der Formanten bestimmt.
    Daraus ergab sich das Konzept des Formantverschiebers (Tillmann 1980), der in folgendem Diagramm schematisch dargestellt ist.

    Nach Tillmann (1980)

    Der Formantverschieber zeigt, wie sich die Formantlagen für den ersten bis dritten Formanten aus der neutralen Lage (Schwa-Laut) heraus ändern, wenn bestimmte Bereiche des Ansatzrohres verengt oder erweitert werden. Ein Pluszeichen bedeutet Erhöhung, ein Minuszeichen Erniedrigung des Formanten durch Verengung/Erweiterung in diesem Bereich des Ansatzrohres (z=0 : Glottis, z=L : Mundöffnung). Eine Erweiterung ist als nach unten offenes Feld, eine Verengung als nach oben offenes Feld gezeichnet.

    Beispiele:

    Abbildung Artikulation auf Akustik

    Wie schon aus dem Bild des Formantschiebers ersichtlich, gibt es mit diesem Modell mehrere geometrische Möglichkeiten, eine bestimmte Formantlage zu erzeugen. Schroeder (1967) hat darauf bereits hingewiesen. Eine Abbildung der Stellung des Artikulationstrakts auf das akustisches Signal ist demnach zwar eindeutig, aber nicht eineindeutig. Mit anderen Worten, aus der Stellung des Vokaltrakts kann zwar das akustische Signal, aber aus dem akustischen Signal nicht die Stellung des Vokaltrakts eindeutig bestimmt werden.

    Andererseits ist zu bedenken, daß sich der Vokaltrakt in der Realität nicht in völlig beliebige Formen bringen läßt. Es gibt zumindest folgende Einschränkungen:

    Daher ist zu erwarten, daß sich in der Realität doch eine eineindeutige Abbildung beobachten läßt.

  7. Sekundäre Schallerzeugung
  8. Neben der stimmhaften Anregung durch die Glottis gibt es noch zwei andere Möglichkeiten, im Vokaltrakt Schall zu erzeugen. Bei den nachfolgend beschriebenen Anregungsarten sind die Stimmlippen normalerweise weit geöffnet. Ausnahmen sind gemischte Anregungen wie bei stimmhaften Plosiven oder Frikativen, sowie beim Flüstern.

    Durch Verengung des Vokaltrakts

    Die
    Frikative oder Reibelaute werden durch eine Verengung in Vokaltrakt hervorgerufen. Auch hier unterscheiden wir - wie bei den Vokoiden - zwischen der aerodynamischen Quelle und der anschließenden akustischen Filterung des Quellensignals
    Aerodynamisches Modell der stimmlosen Anregung
    Normalerweise herrscht im Vokaltrakt eine laminare Luftströmung, d.h. die Luftmoleküle bewegen sich auf weitgehend parallelen Bahnen. Dabei entsteht kein Schall.
    Wird die Passage jedoch verengt, steigt die Strömungsgeschwindigkeit in Bereich des Hindernisses stark an und damit auch die Reynoldsche Zahl. Überschreitet diese einen kritischen Wert, schlägt die laminare Strömung um in eine chaotisch-turbulente Verwirbelung. Diese lokale Verwirbelung des Luftstroms erzeugt an der Stelle der Verengung ein Schallsignal, welches sich von dort in beide Richtungen des Vokaltrakts ausbreitet.
    Dieses Anregungssignal ist im Gegensatz zum
    periodischen Anregungssignal der Stimmlippen aperiodisch und wird Rauschen genannt. Das Spektrum eines Rauschsignals kann infolge des chaotischen Verhaltens im Zeitbereich nur noch statistisch bestimmt werden und wird kontinuierlich dargestellt.

    Zeitsignal des Frikativs /s/

    Akustisches Modell der Frikative
    Die Verengung des Vokaltrakts kann an mehreren Stellen erfolgen. Je nach Lage der Verengung im Vokaltrakt ergibt sich eine andere geometrische Konfiguration des Resonanzraums, der die Übertragungsfunktion des nachgeschalteten Filters bestimmt.
    Grundsätzlich gelten aber die akustischen Gesetze des Ansatzrohres bei der Bildung von Vokoiden auch hier. Das kontinuierliche Rauschspektrum der Quelle wird an den Formanten des nachfolgenden Ansatzrohres verstärkt, und bei etwaigen Anti-Formanten - wir kommen im nächsten Abschnitt darauf zurück - abgeschwächt.
    Je weiter 'hinten' im Vokaltrakt die Verengung stattfindet, desto stärker wird das Rauschsignal der Quelle verformt. Man nennt dies auch artikulatorische Tiefe (Tillmann 1980).
    Das Rauschsignal der Quelle breitet sich sowohl nach vorne in Richtung Mundöffnung, als auch nach hinten in Richtung Glottis aus. Der Resonanzraum hinter der Engstelle hat jedoch keinen oder nur sehr wenig Einfluß auf das von den Lippen abgestrahlte Sprachsignal.

    Auf die genaue Zuordnung der einzelnen Laute auf den Ort der Artikulation verzichten wir hier, da dies an anderer Stelle ausführlicher beschrieben wird. Als besonderer Fall sei hier nur auf das Flüstern hingewiesen, bei dem die Rauschquelle durch eine stimmlose Verengung an den Stimmlippen verursacht wird.

    Durch Verschluß des Vokaltrakts

    Bei der Bildung der Plosive oder Verschlußlaute haben wir die paradoxe Situation, daß ein Sprachlaut durch das zeitweise Fehlen jeglicher Anregung charakterisiert ist (engl. silent interval, s.i.). Der Vokaltrakt verengt sich für eine kurze Zeitspanne (40 - 100 ms) zum luftdichten Verschluß, der - in den meisten Fällen - von einer impulsartigen Druckwelle (engl. burst) gesprengt wird.

    Daß schon eine reine Pause im Zeitsignal ausreicht, um den Höreindruck eines Plosivs zu erzeugen, zeigt folgendes Experiment:
    Man fügt in eine Aufnahme des Wortes 'Hoffen' unmittelbar vor dem Frikativ /f/ eine Pause von 60 ms ein. Beim Abspielen versteht man deutlich das Wort 'Hopfen'.

    Original 'Hoffen'

    'Hoffen' mit Pause vor dem 'f'

    Der klassische Plosiv, wie er hier beschrieben wird, kommt im deutschen Sprachraum nicht so häufig vor. Daher wollen wir hier noch zwei andere Varianten ansprechen.

    Der stimmhafte Plosiv ist dadurch gekennzeichnet, daß während der 'Verschlußpause' eine stimmhafte Anregung im Signal zu erkennen ist. Im Spektrum ist entsprechend bei niedrigen Frequenzen ein durchgehender, horizontaler Balken (eng. voice bar) zu sehen. Die Verschlußlösung ist teilweise nur noch ein winziger Impuls, der der stimmhaften Schwingung überlagert ist.

    Zeitsignal des stimmhaften Plosivs /d/

    Kommt es kurz nach der Verschlußlösung infolge der Verengung zu einer kurzen Friktion, so spricht man von einem aspirierten Plosiv.

    Löst sich der Verschluß in einen richtigen Frikativ, so spricht man auch von einem Affrikaten, z.B. in 'Hopfen'.

    Zeitsignal und Spektrum des aspirierten Plosivs /t/

    Auch wenn während des eigentlichen Verschlusses von keinem Signal bzw. Spektrum (und auch nicht von Aerodynamik) gesprochen werden kann, ist doch die Lage des Verschlusses in Vokaltrakt in den angrenzenden Bereichen um den Plosiv aus den Formantbewegungen erkennbar. Wir werden auf diesen akustischen Effekt in einem späteren Abschnitt noch ausführlicher eingehen.
    Das Gesetz der artikulatorischen Tiefe gilt analog zu den Frikativen auch hier.
    Auch hier verzichten wir auf die genaue Zuordnung der einzelnen Laute auf den Ort der Artikulation, da dies an anderer Stelle ausführlicher beschrieben wird.

  9. Ankopplung des Nasenraums - Nasale
  10. Bis jetzt haben wir die Akustik des Vokaltrakts ohne den Nasenraum betrachtet, d.h. wir setzten immer voraus, daß das Gaumensegel oder Velum angehoben sei und so den Nasenraum vom übrigen Vokaltrakt abtrennte.

    Periode eines typischen Nasals

    Beim Senken des Velums wird der Nasenraum bis hin zu den Nasenlöchern akustisch an den Vokaltrakt angekoppelt. Je nach der Stellung des übrigen Vokaltrakts ergeben sich - bei stimmhafter Anregung - die folgenden Möglichkeiten:

    Freie Passage im Mundraum

    Durch die Ankoppelung des Nasenraums entstehen analog zu unserem Modell des Ansatzrohres stehende Wellen im abzweigenden Nasenraum. Durch Resonanz dieser stehenden Wellen wird dem Schallfluß im restlichen Ansatzrohr Energie bei bestimmten Frequenzen entzogen. Im Spektrum des schließlich von den Lippen abgestrahlten Sprachsignals zeigt sich dies in Form von Einbrüchen bei diesen Frequenzen, den sogenannten Anti-Formanten oder Anti-Resonanzen.
    Gleichzeitig wird auch von den Nasenlöchern - parallel zum Schallfeld der Mundöffnung - ein Schallfeld abgestrahlt, welches andere Resonanzen im Spektrum betont. Beide Schallfelder überlagern sich im Fernfeld und führen zu einer akustisch sehr komplexen Konfiguration. Die genauen Details der Nasalierung sind derzeit noch Gegenstand der Forschung.
    Das auditive Ergebnis dieses Vorgangs sind nasalierte Vokale, die im deutschen Phonemsystem (Phonologie) eigentlich nicht vorkommen, aber in der Realität - und nicht nur in Fremdwörtern - natürlich nachgewiesen werden können.

    Lippen geschlossen - Zunge gesenkt

    Bei geschlossenen Lippen findet die akustische Abstrahlung nur noch von den Nasenlöchern statt. Die Situation kehrt sich nun quasi um:
    Die vorne abgeschlossene Mundhöhle wirkt als Resonanzhohlraum, der dem Ansatzrohr von Glottis bis Nasenlöchern bei bestimmten Antiformanten Energie entzieht. Sind nur die Lippen geschlossen, ist die ganze Mundhöhle Resonanzraum. Das auditive Ergebnis dieser akustischen Konfiguration ist der Nasal /m/.

    Lippen geöffnet - Verschluß Zunge - Zahndamm

    Der Verschluß liegt nun 'tiefer' - im Sinne der artikulatorischen Tiefe nach Tillmann (1980) - in der Mundhöhle und veringert somit den angekoppelten Resonanzraum der Mundhöhle. Die Lage der Anti-Formanten wird dadurch verändert und es entsteht der auditive Eindruck des Nasals /n/.

    Lippen geöffnet - Verschluß Zunge - weicher Gaumen

    Liegt der Verschluß an der Stelle dicht vor dem gesenkten Velum, auf dem weichen Gaumen, entsteht - entsprechend der oben bereits beschriebenen akustischen Konfiguration - der auditive Eindruck des Eng-Lauts, Nasal /N/, wie in 'lang'. Da die Zunge bei dieser Konfiguration normalerweise dicht am weichen Gaumen anliegt, ist keine geschlossene Kavität in der Mundhöhle mehr vorhanden, die Anti-Resonanzen bewirken könnte. Der Eng-Laut ist somit wieder ein klassischer Fall eines einfachen Ansatzrohres, welches nun aber über den Nasenraum führt.

  11. Beispiele Formanttransitionen
  12. Transitionen Plosiv - Schwa

    Aus dem bisher Erläuterten wollen wir jetzt die dynamische Bewegung der ersten drei Formanten für drei einfache Silben vorhersagen. Die drei Silben bestehen jeweils aus einem
    stimmhaften Plosiv (/b/, /d/ und /g/) und den anschließenden Neutralvokal Schwa.

    Aus dem Abschnitt Sekundäre Schallerzeugung wissen wir, daß es sich hierbei um Verschlüsse des Vokaltrakts im vorderen Teil des Ansatzrohrs (Mundhöhle) handelt und einer anschließenden offenen Passage (Vokoid) mit gleichmäßigem Verlauf der Querschnittsfläche über den gesamten Vokaltrakt (Neutralvokal Schwa).
    Die Verschlüsse /b/, /d/ und /g/ haben zunehmende artikulatorische Tiefe von den Lippen bis zum Gaumen.

    Mit Hilfe des Formantverschiebers können wir nun die Bewegung der ersten drei Formanten beim Übergang von Verschluß zum Neutralvokal vorhersagen:

    Die Formantlage bei Beginn der Silben läßt sich aus den Diagramm des Formantverschiebers ablesen, wenn wir folgende Positionen für die drei verschiedenen Plosive festlegen:

    Plosiv /b/ : Letztes Achtel des Vokaltrakts (Lippen)
    Plosiv /d/ : Siebtes Achtel des Vokaltrakts (Alveolen)
    Plosiv /g/ : Fünftes Achtel des Vokaltrakts (Gaumen)

    Am Ende der Bewegung müssen alle drei Formanten bei allen drei Beispielen äquidistant liegen, wie wir es an früherer Stelle für den neutralen Vokoiden Schwa hergeleiten haben.

    Damit ergibt sich folgende Formantverläufe für unsere Beispielsilben:

    Solche oder sehr ähnliche Formantverläufe lassen sich an tatsächlich gemessenen Signalen im Sonagramm erkennen.

    Mit Hilfe des Pattern Playback Verfahrens konnten Wissenschaftler des MIT schon sehr früh künstliche Formantverläufe hörbar machen. Ein schönes Beispiel demonstriert genau die Wahrnehmung verschiedener Plosiv-Qualitäten durch künstliche Veränderung des zweiten und dritten Formanten.

    Transitionen zwischen Vokoiden

    Neben den charakteristischen Übergängen zwischen Kontoiden und Vokoiden gibt es natürlich auch die Formantübergänge zwischen zwei Vokoiden (wie z.B. in Diphtongen /aI/, /aU/ und /OY/).

    Die folgende Darstellung zeigt die Veränderung des ersten und des zweiten Formanten beim vokalischen Übergang von /u/, über /o/, /a/, /e/ bis zum /i/.

Fragen


  1. Was beschreibt der Formantverschieber?
  2. Charakterisieren Sie das Spektrum eines Vokoiden.
  3. Charakterisieren Sie das Spektrum eines Frikativs.
  4. Beschreiben Sie den Verlauf des Zeitsignals in einem Plosiv.
  5. Ist Phonation (Stimmanregung) ein akustischer oder ein aerodynamischer Effekt?
  6. Wie verändert sich ein Vokoidspektrum beim Fisteln?
  7. Beschreiben Sie die Schallerzeugung von frikativen Lauten (Reibelaute).
  8. Was versteht man unter einer Formanttransition und wie wird sie im akustischen Modell des Ansatzrohres erklärt?

Antworten


Sollten Sie diese Seite als Papierausdruck vorliegen haben, finden Sie das Orginal Hypertext-Dokument unter folgender URL:

http://www.phonetik.uni-muenchen.de/AP/APKap1.html

Beachten Sie, daß alle Audio-Demonstrationen natürlich nur mit dem Orginal Dokument möglich sind.


Copyright © 1995 Institut für Phonetik und Sprachliche Kommunikation, Universität Müchen
Diese und alle weiteren hier referenzierten Seiten mit der Initiale 'AP' im Filenamen dürfen kopiert, gedruckt und an Dritte weitergegeben werden, unter der Bedingung, daß jede Seite vollständig bleibt. Weitergabe von Auszügen nur mit Erlaubnis der Urheber.

Florian Schiel