Das Lesen von Sonagrammen V1.0 - Beispielanalyse

Kirsten Machelett

Inhalt:

  1. Die Äußerung segmentieren und Segmente numerieren
  2. Eine Analyse-Tabelle anlegen
  3. Die Kennzeichnung der Stimmhaftigkeit
  4. Konsonant oder Vokal
  5. Die Bestimmung der Lautklasse
  6. Die Feinklassifikation: phonetisch enge Transkription
  7. Die Umsetzung der phonetisch engen Transkription

    Beispielanalyse

      Dieses Kapitel enthält einen möglichen Ablauf bei der Segmentierung eines Sonagramms und der Identifikation seiner Segmente. Eine zusätzliche 'Kontextinformation' ist bekannt: es handelt sich um ein dreistelliges Zahlwort.

      Das Sonagramm in Abbildung 4B.1 zeigt das unsegmentierte Sonagramm des gesuchten dreistelligen Zahlwortes.

      Abb. 4B.1:Unsegmentiertes Sonagramm der Beispiel-Äußerung

    1. Die Äußerung segmentieren und Segmente numerieren
    2. Um das Sonagramm zu identifizieren, müssen wir mit seiner Segmentierung beginnen. Die Segmentierung wird nach phonologischen Gesichtspunkten erfolgen, so daß bei der später erfolgenden phonetisch engen Transkription jedem Segment genau ein phonetisches Symbol zugeordnet werden kann. Das Festlegen der meisten Segmentgrenzen ist nicht allzu schwierig. Es werden im folgenden nur solche Grenzen erläutert, die nicht auf Anhieb einleuchtend erscheinen. Das Sonagramm in Abbildung 4B.2 enthält bereits Segmentgrenzen, die das Sonagramm in 14 Segmente sprich Phoneme unterteilt.

      Abb. 4B.2:Segmentiertes Sonagramm der Beispiel-Äußerung

      Die Grenzen zwischen folgenden Segmenten gelten als eindeutige Grenzen: 1/2, 2/3, 6/7, 8/9, 9/10, 10/11 und 13/14, da wir uns bei ihnen rein an der äußeren 'Form' der Segmentmuster orientieren können, ohne nähere sonagraphische Kenntnisse zu besitzen.
      3/4: Daß eine Grenze zwischen 3. und 4. Segment existiert, wird nicht bezweifelt werden. Die exakte Grenze dagegen ist wesentlich uneindeutiger zu bestimmen. Als mögliche Richtlinie kann die kleine Lücke zwischen Verschlußlösung (Burst) und folgendem frikativen Segment gelten.
      4/5: Die Grenze zwischen 4. und 5. Segment wird anhand des Frequenzbereiches zwischen 3000 Hz und 8000 Hz gesetzt, da dort deutliche Veränderungen in der Frequenzstruktur zu erkennen sind.
      5/6: Die Grenze zwischen 5. und 6. Segment ist zu Beginn der klaren Formantstrukturen im Frequenzbereich ab 1000 Hz zu setzen.
      7/8: Das Segment 8 enthält den bereits im folgenden Kapitel 3 "Leicht zu übersehene Laute" beschriebenen Plosiv, der einem (homorganen) Nasal folgt. Entsprechend beginnt das folgende Segment nicht mit Beginn des Bursts, sondern erst kurz danach.
      9: Die im Segment 9 erkennbare kleine Lücke lediglich im dritten Formanten bietet keinen hinreichenden Anlaß für eine weitere Segmentgrenze. Erst wenn sich diese Lücke in allen Formanten zeigen würde, müßte eine Segmentgrenze vermutet werden.
      11/12: Die Grenze zwischen 11. und 12. Segment mag nicht auf Anhieb einsichtig erscheinen. Da wir jedoch bei der phonetisch engen Transkription auch einen Glottal-Stop notieren, der uns noch dazu als wichtiger Hinweis auf eine Silbengrenze dient, müssen wir in diesem Fall dem harten Stimmeinsatz ein eigenes Segment zuordnen.
      12/13: Diese Grenze ist erkennbar an der kleinen Einkerbung an der Obergrenze des ersten Formanten und der darüberliegenden burstähnlichen Linie.
      13/14: Zum Ende von Segment 13 fällt der erste Formant ab. Im Folgenden ist keine Formantstruktur mehr zu sehen, dafür aber eine relativ gleichmäßige Schwärzung über den gesamten Frequenzbereich.

    3. Eine Analyse-Tabelle anlegen
    4. Prinzipiell können sämtliche nun folgende Klassifizierungen über dem jeweiligen Segment notiert werden. Da diese Möglichkeit jedoch oft Platzprobleme beschert, legen wir alternativ folgende Tabelle an, die im Laufe der Analyse schrittweise ausgefüllt wird.
      Die erste Spalte enthält die Segmentnummer. Es folgen Spalten zur Entscheidung über die Stimmhaftigkeit und darüber, ob es sich um einen Vokal oder einen Konsonanten handelt. In die nächsten Spalten der Tabelle werden ermittelte Lautklasse und Alternativen für die phonetisch enge Transkription eingetragen.

      Nr. sth./stl. K/V Lautklasse SAMPA Begründung / Anmerkungen
      1 . . . . .
      2 . . . . .
      3 . . . . .
      4 . . . . .
      5 . . . . .
      6 . . . . .
      7 . . . . .
      8 . . . . .
      9 . . . . .
      10 . . . . .
      11 . . . . .
      12 . . . . .
      13 . . . . .
      14 . . . . .

      Abb. 4B.3: Analyse-Tabelle

    5. Die Kennzeichnung der Stimmhaftigkeit
    6. Nun wird für jedes Segment entschieden, ob es stimmhaft oder stimmlos ist. Teilweise stimmhafte Segmente können entweder eine eigene Kennzeichnung bekommen oder unter 'stimmhaft' eingeordnet werden.

      Segment 3 ist nur zu Beginn stimmhaft. Die Schwärzung bei 0-200 Hz ist durch Hintergrund- geräusche entstanden. Da es sich hier offensichtlich um die Verschlußphase eines Plosivs handelt, die häufig stimmhaft beginnt, klassifizieren wir das Segment als entstimmt/stimmlos.

      Nr. sth./stl. K/V Lautklasse SAMPA Begründung / Anmerkungen
      1 stimmhaft . . . .
      2 stimmhaft . . . .
      3 entstimmt . . . .
      4 stimmlos . . . .
      5 stimmlos . . . .
      6 stimmhaft . . . .
      7 stimmhaft . . . .
      8 stimmhaft . . . .
      9 stimmhaft . . . .
      10 stimmlos . . . .
      11 stimmhaft . . . .
      12 stimmhaft . . . .
      13 stimmhaft . . . .
      14 stimmlos . . . .

      Abb. 4B.3: Stimmhaftigkeit eingetragen

    7. Konsonant oder Vokal
    8. Nun entscheiden wir für jedes Segment, ob es sich um einen Vokal oder einen Konsonanten handelt. Grundvoraussetzung für Vokale ist ein stimmhaftes Segment, das zudem Formantstrukturen erkennen lassen muß. Weist das Segment sowohl konsonantische als auch vokalische Eigenschaften auf, so daß eine klare Entscheidung für eine der beiden Optionen unmöglich ist, sollte das ebenfalls vermerkt werden. In diesem Fall könnte es sich um einen Liquid (Lateral, Glide, Trill) handeln.
      Das Segment 5 weist ebenfalls Formantstrukturen auf. Da es jedoch stimmlos ist und besonders im Vergleich mit dem unmittelbar folgenden Vokal nur eine sehr geringe Intensität hat, wird es sich in diesem Fall vermutlich um einen stimmlosen Frikativ, also einen Konsonanten handeln.
      Das stimmhafte Segment 13 zeigt zwar Formantstrukturen, doch ist deren Intensität deutlich schwächer als die des vorausgehenden Vokals. Die Grenze zwischen Segment 12 und 13 könnte eine Lateralverschluß-Lösung sein, so daß es sich bei Segment 13 vermutlich um einen Lateral handeln wird. Wir klassifizieren es also als Konsonant.

      Nr. sth./stl. K/V Lautklasse SAMPA Begründung / Anmerkungen
      1 stimmhaft Konsonant . . .
      2 stimmhaft Vokal . . .
      3 entstimmt Konsonant . . .
      4 stimmlos Konsonant . . .
      5 stimmlos Konsonant . . .
      6 stimmhaft Vokal . . .
      7 stimmhaft Konsonant . . .
      8 stimmhaft Konsonant . . .
      9 stimmhaft Vokal . . .
      10 stimmlos Konsonant . . .
      11 stimmhaft Konsonant . . .
      12 stimmhaft Vokal . . .
      13 stimmhaft Konsonant . . .
      14 stimmlos Konsonant . . .

      Abb. 4B.4: Entscheidung, ob die Segmente konsonantisch oder vokalisch sind

    9. Die Bestimmung der Lautklasse
    10. Bei Konsonanten wird eine der Lautklassen 'Plosiv', 'Frikativ', 'Trill', 'Lateral' oder 'Nasal' eingetragen. Im Zweifelsfall werden beide Möglichkeiten vermerkt. Bei Vokalen wird anhand der Lage der Formanten zueinander bestimmt, ob es sich um einen vorderen, hinteren oder zentralen Vokal handelt. Bei vorderen Vokalen liegen die beiden ersten Formanten weit auseinander, bei den hinteren liegen sie zusammen etwa unter 1000 Hz. Zentrale, nicht tiefe Vokale sind in der Regel unbetont und deshalb kurz und häufig reduziert.
      Bei den Segmenten 2 und 12 handelt es sich um vordere Vokale, da F2 und F3 hoch und relativ eng zusammen liegen. Der relativ hohe F1 spricht für einen mittelhohen Vokal.
      Bei Segment 6 liegen die beiden ersten Formanten sehr eng zusammen und relativ hoch, was für einen hinteren, eher tiefen Vokal spricht. Für diese These spricht auch der recht große Abstand zwischen F2 und F3.
      Bei Segment 9 handelt es sich um einen zentralen Vokal, da seine Formanten äquidistant liegen.
      Die Segmente 1, 4 und 14 sind zweifelsfrei als Frikative zu identifizieren. Hinzu kommt Segment 5, das wir zuvor bereits als Frikativ identifiziert haben.
      Die Segmente 3 und 10 sind ebenfalls deutlich als Plosive zu identifizieren. Weniger eindeutig ist das der Fall bei Segment 8, dem ein Nasal vorausgeht. Die gegen Segmentende stark absinkende Energie, eine kleine 'Lücke' im Signal und der anschließend erkennbare Burst geben uns jedoch nähere Hinweise auf den vermutlich homorganen Plosiv.
      Beim Segment 11 handelt es sich trotz Signallücke nicht um einen Plosiv sondern um einen Glottal- Stop. Kennzeichen des Glottal-Stops sind hier mehrere, voneinander abgesetzte Verschluß- lösungen mit Energieschwerpunkten genau in Höhe der Formanten des folgenden Vokals.
      Beim Segment 7 muß es sich aufgrund des starken Frequenzeinbruchs nach dem Vokal in Segment 6 um einen Nasal handeln.
      Segment 13 haben wir bereits aufgrund sowohl vokalischer als auch konsonantischer Eigenschaften als Lateral klassifiziert. Die Option 'Nasal' kommt aufgrund der relativ hohen Intensität besonders oberhalb von 3000 Hz - gerade auch im Vergleich zum Nasal in Segment 7 - nicht in Frage.

      Nr. sth./stl. K/V Lautklasse SAMPA Begründung / Anmerkungen
      1 stimmhaft Konsonant Frikativ . .
      2 stimmhaft Vokal vorn, mittelhoch . .
      3 entstimmt Konsonant Plosiv . .
      4 stimmlos Konsonant Frikativ . .
      5 stimmlos Konsonant Frikativ . .
      6 stimmhaft Vokal hinten, tief . .
      7 stimmhaft Konsonant Nasal . .
      8 stimmhaft Konsonant Plosiv . .
      9 stimmhaft Vokal zentral . .
      10 stimmlos Konsonant Plosiv . .
      11 stimmhaft Konsonant Glottal-Stop . .
      12 stimmhaft Vokal vorn, mittelhoch . .
      13 stimmhaft Konsonant Lateral . .
      14 stimmlos Konsonant Frikativ . .

      Abb. 4B.5: Bestimmung der Lautklasse eingetragen

    11. Die Feinklassifikation: phonetisch enge Transkription
    12. Nun erfolgt die nähere Bestimmung der Segmente möglichst in Form einer phonetisch engen Transkription. Bei nicht eindeutig klassifizierbaren Segmenten arbeiten wir mit Angabe von erster, zweiter und dritter Wahl. Alternativmöglichkeiten werden genauer begründet und unter Berücksichtigung phonotaktischer Regeln geprüft.

      Nr. sth./stl. K/V Lautklasse SAMPA Begründung / Anmerkungen
      1 stimmhaft Konsonant Frikativ [z] da Energieschwerpunkt oberhalb 5000 Hz
      2 stimmhaft Vokal vorn, mittelhoch [e]/[E] F2, F3 hoch und rel. eng zusammen
      3 entstimmt Konsonant Plosiv [k] F2/F3 des vorausgehenden, vorderen Vokals konvergieren
      4 stimmlos Konsonant Frikativ [s] da Energieschwerpunkt ab etwa 5000 Hz
      5 stimmlos Konsonant Frikativ [h] wegen Formantstruktur und Phonotaktik
      6 stimmhaft Vokal hinten, tief [O]/[A] F1, F2 eng zusammen und rel. hoch, F2, F3 weiter auseinander
      7 stimmhaft Konsonant Nasal [n] F2 etwa bei 1800 Hz , alveolar
      8 stimmhaft Konsonant Plosiv [d] homorgan zu [n]
      9 stimmhaft Vokal zentral [@]/[6] Formanten äquidistant
      10 stimmlos Konsonant Plosiv [t] unterbrochener Burst, Lokus bei etwa 2000 Hz
      11 stimmhaft Konsonant Glottal-Stop [?] .
      12 stimmhaft Vokal vorn, mittelhoch [e]/[E] F2, F3 hoch und rel. eng zusammen
      13 stimmhaft Konsonant Lateral [l] -
      14 stimmlos Konsonant Frikativ [f] da flaches Spektrum ohne Strukturen

      Abb. 4B.6: Vollständig ausgefüllte Analysetabelle

      Die Artikulationsstelle der Frikative in Segment 1 und 4 ist alveolar, da ihr Energieschwerpunkt oberhalb von etwa 5000 Hz liegt.
      F2 und F3 des vorausgehenden, nicht-hinteren Vokals in Segment 2 konvergieren zu Beginn des Segments 3, so daß es sich um einen velaren Plosiv handeln wird.
      Die Formantstrukturen des Frikativs in Segment 5 entsprechen in etwa denen des Folgevokals, was auf ein [h] hinweist. Gemäß der Phonotaktik (zwei Frikative in Folge) müßte es sich hier um eine Silbengrenze handeln.
      Der zweite Formant des Nasals in Segment 7 steigt vom vorausgehenden Vokal zum Nasal und liegt etwa bei 1800 Hz, so daß es sich um einen alveolaren Nasal handeln wird. Da es sich bei dem vorausgehenden Vokal um einen hinteren handelt, deuten die konvergierenden Formanten ebenfalls auf die Artikulationsstelle alveolar.
      Der Plosiv in Segment 8 ist vermutlich homorgan zum vorausgehenden Nasal, da Transitionsbewegungen nicht zu erkennen sind. Parallel verlaufender F2 und F3 zu Beginn des Folgevokals weisen ebenfalls auf die Artikulationsstelle alveolar.
      Der Plosiv in Segment 10 weist eine unterbrochene Burststruktur auf und sein Lokus liegt bei bei etwa 2000 Hz, so daß es sich um einen alveolaren Plosiv handeln wird. Die Transitionen des vorausgehenden Vokals steigen, was einen labialen Plosiv ausschließt. F2 und F3 verlaufen zudem weitgehend parallel und konvergieren nicht, so daß auch ein velarer Plosiv ausgeschlossen werden kann. Außerdem fehlt der für den velaren Plosiv typische Frequenzschwerpunkt des Bursts.
      Der Glottal-Stop in Segment 11 weist ebenfalls auf eine Silbengrenze hin.
      Der Frikativ in Segment 14 weist keinerlei Strukturen oder einen Frequenzschwerpunkt auf. Neben dem flachen Spektrum gelten auch die fallenden Transitionen des vorausgehenden Laterals als Hinweis auf einen labiodentalen Frikativ.
      Bei den vorderen, mittelhohen Vokalen in Segment 2 und 12 wird es sich um ein [e] oder [E] handeln. Der hintere, tiefe Vokal in Segment 6 wird etwas /o/-/a/-ähnliches sein, also ein [O] oder eventuell ein tiefes, hinteres /a/. Da dieser Vokal sehr kurz ist, wurde er wahrscheinlich reduziert, so daß seine 'ursprüngliche' Vokalqualität verlorengegangen sein könnte.
      Beim zentralen Vokal in Segment 9 wird es sich um einen Schwa-ähnlichen Laut handeln.

    13. Die Umsetzung der phonetisch engen Transkription
    14. Im letzten Schritt werden wir versuchen, die phonetisch enge Transkription in die gesuchte Äußerung umzusetzen. Folgendes Transkript haben wir bereits entschlüsselt:

      [z e/E k s ' h O/A n d @/6 t ' ? e/E l f]

      Das Apostroph gilt dabei als Silbengrenze, der Schrägstrich kennzeichnet mögliche Alternativen. Das gesuchte Zahlwort lautet '611'. Die Abbildung 4B.7 zeigt das segmentierte und gelabelte Sonagramm des Zahlwortes "611".

      Abb. 4B.7: Segmentiertes und gelabeltes Zahlwort "611" :


    Copyright © 1996 Institut für Phonetik und Sprachliche Kommunikation, Universität München
    Diese und alle weiteren hier referenzierten Seiten mit der Initiale 'SGL' im Filenamen dürfen kopiert, gedruckt und an Dritte weitergegeben werden, unter der Bedingung, daß jede Seite vollständig bleibt. Weitergabe von Auszügen nur mit Erlaubnis der Urheber.

    Kirsten Machelett