Susanne Burger
Institut für Phonetik und sprachliche Kommunikation
München
(Lexikon zum "Handbuch zur Datenaufnahme und Transliteration
in TP14 von VERBMOBIL -3.0"
Kohler,Lex,Pätzold,Scheffers,Simpson,Thon
Kiel,September1994)
Eine Postscript-Version des Handbuchs ist am IPDS
in Kiel erhältlich.
Same page in English
Inhalt
Memo 111: Aussprachevarianten in der VERBMOBIL-Transliteration - Regeln zur konsistenteren Verschriftung (Burger, Kachelrieß, München, August 1996)
Dieses Memo schlägt Regeln zur konsistenteren Verschriftung der VERBMOBIL-Aussprachekommentare auf orthographischer Ebene vor.
Alle in Verbmobil aufgenommenen Dialoge werden transliteriert
Umlaute und Sz werden nach LaTex-Format verschriftet.
Es gibt nur Punkt, Komma und Fragezeichen.
Nach Punkt und Fragezeichen wird klein weiter geschrieben, sofern es sich
nicht um ein Substantiv handelt. Vor und nach dem Interpunktionszeichen
steht jeweils ein Leerzeichen. Generell ist die Zeichensetzung bei Spontansprache
mit Schwierigkeiten verbunden, da grammatikalisch "richtige"
Sätze häufig fehlen.
Symbol: " . "
steht am Satzende zwischen Leerstellen
Beispiel:
... so , guten Tag , mein Name ist <!1 is'> J"ansch . <"ah> wir hatten bereits telefoniert<Z> . ...
Anmerkung:
In Zweifelsfällen entscheidet, ob ein " . " gesetzt wird oder nicht:
Symbol: " ? "
steht am Ende einer Frage zwischen Leerstellen
Beispiel:
... <A> wie schaut 's denn aus , den darauffolgenden Sonntag , den <:<#Mikrobe> neunundzwanzigsten:> bei Ihnen ? geht 's da ? ...
Anmerkung:
In Zweifelsfällen entscheidet, ob ein " ? " gesetzt wird oder nicht:
Symbol: " , "
steht zwischen Satzteilen oder Nebensätzen zwischen Leerstellen
Beispiel:
... <"ahm> morgen , Freitag , <h"as> wie ich seh' , <"ah> mu"s ich feststellen , da"s ich <"ah> "uberhaupt keine Zeit hab' . ...
Anmerkung:
In Zweifelsfällen entscheidet, ob ein " , " gesetzt wird oder nicht:
z.B.:
a) ich k"onnte schon , mittwochs hab' ich immer Zeit . b) ich k"onnte schon . <P> <A> mittwochs hab' ich immer Zeit .
Großbuchstabe Kleinbuchstabe :> <A> (nur bei Ausatmen!) <Z> <%> <!n ..> <;..>
Ein Transliterations-File besteht aus einem Header
Beispiel:
; Dialog N057K ; zuletzt bearbeitet am 23.5.94 ; Tonqualit"at: (allgemeine Kommentare zu ; Sprechern oder zur Aufnahmequalit"at des ; Dialogs)
und einem Textteil,
der durch eine Leerzeile vom Header getrennt ist.
Im Textteil werden die einzelnen Turns des Dialogs transliteriert. Jeder
Turn beginnt mit dem dreibuchstabigen Sprecherkürzel und der Turnnummer,
beginnend bei 000. Nach der Turnnummer steht ein Doppelpunkt, gefolgt von
einem Leerzeichen.
Dann folgt der eigentliche Text. Wörter werden nicht getrennt, an
jedem neuen Zeilenanfang innerhalb des Turns stehen acht Leerzeichen. In
der Zeile nach einem Turn kann noch ein mit ";" eingeleiteter
Kommentar folgen, der sich auf den ganzen vorangegangen Turn bezieht. Die
einzelnen Turns sind durch jeweils eine Leerzeile voneinander getrennt.
Beispiel:
AAP000: so , guten Tag , mein Name ist <!1 is'> J"ansch . <"ah> wir hatten bereits telefoniert<Z> , mein Name J<Z>"ansch , $J $"A $N $S $C $H , wegen <:<#Mikrobe> eines Arbeitstreffens:> . BBP001: gr"u"s Gott , mein Name ist G<Z>"urtner , <A> <"ahm> $G $"U $R $T $N $E $R <A> . <A> <"ahm> ;Brummen "uber gesamtem Turn AAP002: ja , <:<#Mikrobe> ich kuck' jetzt:> mal nach bei mir , wann ich <A> einen <!1 ein'> Termin frei h"atte . <A> das <:<#Mikrowind> erste:> w"are <Schmatzen> in der Woche oder die Tage vom vierzehnten Juli bis zum achtzehnten <:<#Mikrobe> Juli:> . <A> ginge das bei <:<#> Ihnen:> ? BBP003: ...
Symbol............Bedeutung $.................Buchstabieren *.................Nichtwort/Versprecher <"ah>............. <"ahm>............ <hm>.............. <h"as>............Häsitation/gefüllte Pause <Schmatzen>....... <Schlucken>....... <R"auspern>....... <Husten>.......... <Lachen>.......... <Ger"ausch>.......nonverbale artikulatorische Geräusche <Z>...............Zögern <A>...............Atmen <P>...............Pause li_blank..........Wortunterbrechung: linker Wortteil (Subline,Leerstelle) blank_re..........Wortunterbrechung: rechter Wortteil (Leerstelle,Subline) =.................Wortabbruch /-................Phrasenabbruch +/................Selbstkorrektur: linke Grenze /+................Selbstkorrektur: rechte Grenze %.................Schwerverständliches <%>...............Unverständliches <;..>.............Kommentar <;T>..............technischer Abbruch <! ..>............Aussprachekommentar <#Klicken>........ <#Klingeln>....... <#Klopfen>........ <#Mikrobe>........ <#Mikrowind>...... <#Rascheln>....... <#Quietschen>..... <#>...............nichtartikulatorische Geräusche <:................Überlagerungsanfang :>................Überlagerungsende (.................Überlappungsanfang ( und (@ ).................Überlappungsende ) und @)
Im Text der TRL-Files finden sich viele Sonderzeichen, die zur besseren Niederschrift von spontansprachlichen Phänomenen definiert wurden.
Im folgenden sollen alle verwendeten Symbole anhand von Beispielen kurz
beschrieben werden.
Ein Eintrag enthält jeweils
Beispiel:
... mein Name ist J<Z>"ansch , $J $"A $N $S $C $H ...
Symbol: $
Jeder buchstabierte Buchstabe wird groß geschrieben,
$ wird vorangestellt.
( +/ - Leerstelle
Beispiel:
... *haarknapp <:<#Rascheln> um einen <!1 ein'> Tag verfehlt ... ... was *exkursieren Sie denn ? ...
Symbol: *
Als Nichtwort gelten:
Dem Nichtwort wird * ohne Leerstelle vorangestellt.
( +/ <;T> Leerstelle
Beispiel:
... <"ah> wir hatten bereits telefoniert<Z> ... ... gu<Z>t , <"ahm> wie w"ar' es bei Ihnen am<Z> neunzehnten Juli ... ... ich denke/- <hm> also bei mir ginge es sehr gut ... ... w"urd' ich sagen , <A> <h"as> wenn wir ...
Symbol: <"ah> <"ahm> <hm> <h"as>
Häsitationen stehen zwischen <>
( <;T> Leerstelle
Beispiel:
... Mittagessen <P> <Schmatzen> und<Z> , na ja ... ... ordentlich planen mu"s und <"ah> <Schlucken> wann w"urde Ihnen ... ... einverstanden . <P> <R"auspern> auf Wiedersehen ... ... +/je/+ <Husten> je schneller wir das machen ... ... bei <:<Lachen> mir:> terminlich sehr ung"unstig ... ... dann/- <"ah> <A> <Ger"ausch> das sind sechs Termine ...
Symbol: <Schmatzen> <Schlucken> <R"auspern> <Husten> <Lachen> <Ger"ausch>
<Ger"ausch> steht für nicht-zuordenbare Produktionen.
Artikulatorische Geräusche werden zum Zeitpunkt ihrer Produktion
zwischen Leerstellen transliteriert.
Sie können auch andere verbale und nonverbale Produktionen überlagern.
( <: Leerstelle
Beispiel:
... ich h"atte Zeit +/am<Z>/+ <A> <Schmatzen> ab Dienstag ... ... ich dachte ger<Z>ade ...
Symbol: <Z>
<Z> wird ohne Leerstelle an den gedehnten Laut angehängt, unahängig davon, an welcher Stelle des Wortes die Dehnung zu hören ist.
Kleinbuchstabe Großbuchstabe
Beispiel:
... ist G<Z>"urtner , <A> <"ahm> $G $"U $R $T $N $E $R <A> . <A> ...
Symbol: <A>
<A> steht hauptsächlich für Einatmen und deshalb hinter
dem Interpunktionszeichen.
Bei deutlichem Ausatmen am Ende eines Satzteils kann Atmen auch vor einem
Interpunktionszeichen stehen.
( Leerstelle
Beispiel:
... ich habe <P> M"oglichkeiten dazu ...
Symbol: <P>
An Satz-/Satzteilgrenzen steht <P> immer nach dem Interpunktionszeichen.
( Leerstelle
Beispiel:
... Ver_ <A> _pflichtungen ... ... statt_ +/f=/+ <h"as> _findet ...
Symbol: _
Wird ein Wort unterbrochen und nach der Unterbrechung fortgesetzt, so steht nach der Abbruchstelle _ ohne Leerstelle und vor der Fortsetzungsstelle _ ohne nachfolgende Leerstelle. Alle während der Unterbrechung stattfindenden Ereignisse werden getrennt durch Leerstellen zwischen den Wortteilen notiert.
- <Z> Großbuchstabe Kleinbuchstabe
Leerstelle
Beispiel:
... +/sieb=/+ siebzehnter ... ... im Ja=/- also ich sag' Ihnen jetzt ...
Symbol: =
An ein abgebrochenes Wort wird = ohne Leerstelle angehängt.
<Z> Großbuchstabe Kleinbuchstabe
Beispiel:
... ab dem dritten August <A> bis zum/- <P> Moment , ich ... ... ja , ich hab' da eigentlich/- also ich bin vom neunzehnten bis ...
Symbol: /-
Ein Abbruch liegt dann vor, wenn der Sprechakt angehalten und nach dem Abbruch ein neuer Gedankengang begonnen wird. An der Abbruchstelle wird /- ohne Leerstelle angefügt. Hinter /- stehen keine Interpunktionszeichen.
= <A> (nur bei Ausatmen) <Z> <;T> Großbuchstabe Kleinbuchstabe
Beispiel:
.... +/am/+ <:<#Mikrobe> am Donnerstag:> kann ich erst ... ... +/im Sep=/+ im September ... ... die Woche +/von/+ <"ah> mit Freitag ... ... also +/das/+ das/+ das zweite ...
Symbol: +/../+
Bei einer Wiederaufnahme wird nach der Unterbrechungsstelle das vorher Abgebrochene entweder wiederholt oder korrigiert. An der Unterbrechungsstelle wird /+ ohne Leerstelle angefügt. Der Äußerung, die nach der Unterbrechungsstelle dann wiederholt/korrigiert wird, wird +/ ohne nachfolgende Leerstelle vorangestellt, sodaß +/.. /+ das Reparandum klammert.
( Leerstelle
= <A> (nur bei Ausatmen) <Z> <;T> Großbuchstabe Kleinbuchstabe
Beispiel:
... %eins , %zwei , %drei , %vier ... ... wann h"atten Sie %da bitte Zeit ...
Symbol: %
Vor schwerverständlichen Wörtern steht % ohne Leerstelle.
( +/ <;T> Leerstelle
Beispiel:
... aber <A> <"ah> <%> <"ahm> wie w"ar's denn ... ... <%> fr"uher geht 's leider nicht ...
Symbol: <%>
Für Unverständliches steht <%> zwischen Leerstellen.
( Leerstelle
Beispiel:
; Tonqualit"at: viele Nebenger"ausche ... ;gesamter Turn verrauscht ... ... zum Beispiel <;"ubersteuert> ... ... einen Termin vereinbaren <;heiser> ...
Symbol: ;
Ein den ganzen Dialog betreffender Kommentar steht vor dem gesamten Dialog im Header, am Zeilenanfang steht ein Semikolon, nach dem Kommentar folgt eine Leerzeile. Ein Kommentar zu einem Beitrag eines Sprechers wird am Zeilenanfang mit Semikolon eingeleitet und ohne Leerzeile an den Sprecherbeitrag angefügt.
Symbol: <;..>
Lokale Kommentare werden im Text hinter der relevanten Stelle und einer Leerstelle eingefügt, durch ein Semikolon eingeleitet und in spitze Klammern eingeschlossen.
Leerstelle
Beispiel:
... ab ein U<;T> ... ... <;T>neunzehnten is<Z>t etwas schwierig ... ... erste Woche ginge <A> <;T> <#Klicken> <A> <"ah> Montag ... ... unsere Termine alle untergebra<;T> <;T>ke ...
Symbol: <;T>
Durch den Knopfdruck kann die Sprachaufnahme am Anfang oder am Ende
abgeschnitten werden, aber auch innerhalb eines Dialogbeitrags unterbrochen
sein.
Fand der Abbruch während einer lexikalischen Einheit statt, wird <;T>
ohne Leerstelle davor oder danach angehängt. Zwischen zwei aufeinanderfolgenden
<;T> steht eine Leerstelle.
Wurde keine lexikalische Einheit abgeschnitten, steht <;T> zwischen
Leerstellen.
<: +/ <h"as>.. <Z> Großbuchstabe Kleinbuchstabe Leerstelle
Beispiel:
... damit w"ar' das <!1 des> eigentlich klar ... ... dann kommen Sie <!2 komm' Se> doch ... ... wenn wir <!2 wemma> 's die Woche noch machen ...
Symbol: <!n ..>
Dialektaussprachen, andere Stilformen oder sonstige Abweichungen werden
in korrekter Form nach Duden verschriftet. Die eigentlich geäußerte
Version wird hinter der korrekten Form
nach einer Leerstelle
in spitzen Klammern ,
nach einem ! ,
einer Ziffer, die sich auf die betroffenen lexikalischen Einheiten bezieht,
und einer Leerstelle transliteriert.
Hinweis: Genauer definierte Regeln zur konsistenteren Verschriftung von Aussprachekommentaren finden sich im Verbmobil-Memo 111: Aussprachevarianten in der VERBMOBIL-Transliteration - Regeln zur konsistenteren Verschriftung (Burger, Kachelrieß, München, August 1996).
Leerstelle
Beispiel:
.. de<Z>m <:<#Klicken> neunundzwanzigsten:> August ... ... <:<#Klingeln> am Mittwoch st"anden:> ... ... <:<#Klopfen> gern so machen:> ... ... <#Mikrobe> das tut mir leid ... ... ich k"onnte Ihnen <:<#Mikrowind> vorschlagen:> ... ... nach Berlin <P> ausmachen . <#Rascheln> <"ahm> ... ... der gesamte <:<#Quietschen> Rest des Mais:> ... ... k"ame mir gelegen , <A> <#> allerdings ...
Symbol: <#Klicken> <#Klingeln> <#Klopfen> <#Mikrobe> <#Mikrowind> <#Rascheln> <#Quietschen> <#>
<#Klicken> für z.B. Klicken des Knopfdrucks
<#Klingeln> Telefonklingeln
<#Klopfen> z.B. Tischberührung
<#Mikrobe> Mikrofonberührung
<#Mikrowind> ins Mikrofon blasen oder ins Mikrofon atmen
<#Rascheln> z.B. Papierrascheln
<#Quietschen> z.B. Stuhlquietschen
<#> Geräusche, die in keine der anderen Kategorien passen
Nichtartikulatorische Geräusche werden durch vorangestelltes #
in spitzen Klammern
verschriftet.
Sie können auch andere verbale Produktionen oder nichtartikulatorische
Geräusche überlagern.
( <: Leerstelle
Beispiel:
... de<Z>m <:<#Klicken> neunundzwanzigsten:> August ... ... bei <:<Lachen> mir:> terminlich sehr ung"unstig ... ... <:<#Klopfen> <Lachen> k"amen mir die Monate:> April ... ... <:<Lachen> ich habe:> <:<#Klopfen> <Lachen> heute:> keine Zeit ...
Symbol: <:..:>
Nichtartikulatorische Geräusche oder nonverbale artikulatorische
Produktionen,
die Wörter oder andere Ereignisse überlagern, werden zusammen
mit den Wörtern/Ereignissen mit <: :> geklammert.
Nach <: folgt das überlagernde Geräusch, eine Leerstelle und
die
überlagerte Produktion. :> schließt die Klammerung und wird
nach dem
Überlagerten ohne Leerstelle gesetzt.
Bei mehreren überlagernden Ereignissen gilt folgende Reihenfolge:
- nichtartikulatorische Geräusche,
- artikulatorische nonverbale Produktionen,
- verbale Produktionen.
( Leerstelle
/+ /- - <.. > <#.. > <h"as> <A> <Z> <%> <;T> Großbuchstabe Kleinbuchstabe
Beispiel:
PEG004: wollen wir mal die Termine ausmachen , (f"ur die n"achsten@) Monate ? CLK005: (@ja gerne).. gerne.
CLK087: nee , nicht den elften , den<Z> (f"unfzehnten <A>@).. PEG088: (@f"unfzehnten) und den (achtundzwanzigsten@).. CLK089: (@genau <A>)..
HAH008: nein , da mu"s ich zu einem (Besuch@) nach (Leipzig@).. TIS009: (@m).. (@aha)..
HAH008: nein, da mu"s ich zu einem (Besuch@) nach Leipzig.. TIS009: (@m , aha)..
Symbol: (@ bzw. ( , @) bzw. )
Leerstelle
:> /+ /- <Ger"ausch>.. <#>.. <h"as> <A> <P> <Z> <%> <;T> Großbuchstabe Kleinbuchstabe
K.Kohler , G.Lex , M.Pätzold , M.Scheffers , A.Simpson, W.Thon: Handbuch zur Datenaufnahme und Transliteration in TP14 von VERBMOBIL -3.0 , Verbmobil-Report, Nr. 11 , September 1994.
A. Batliner, S. Burger, A. Kießling: Außergrammatische Phänomene in der Spontansprache: Gegenstandsbereich, Beschreibung, Merkmalinventar, Verbmobil-Report, Nr. 57, Februar 1994.
S.Burger, E.Kachelrieß: Aussprachevarianten in der VERBMOBIL-Transliteration - Regeln zur konsistenteren Verschriftung, Verbmobil-Memo, Nr. 111, August 1996.
The VERBMOBIL Project August 1995
Copyright © 1995 Institut für Phonetik
und Sprachliche Kommunikation, Universität Müchen
Diese und alle weiteren hier referenzierten Seiten, welche von diesem WWW
Server stammen, dürfen kopiert, gedruckt und an Dritte weitergegeben
werden, unter der Bedingung, daß jede Seite vollständig bleibt.
Weitergabe von Auszügen nur mit Erlaubnis des Urhebers.
Susanne Burger burger@phonetik.uni-muenchen.de