BAS
Bayerisches Archiv für Sprachsignale
Corpora e Lessici dell'Italiano Parlato e Scritto, map task recordings - CLIPS_MT_MANUAL
Letzter Update dieser Seite: 2014-02-21 -- same page in English
Beschreibung
CLIPS_MT_MANUAL ist ein Sub-Korpus des originalen CLIPS corpus (Corpora e
Lessici dell'Italiano Parlato e Scritto), welcher nur die 30 manuell phonetisch
annotierten Maptask Aufnahmen an 15 verschiedenen italienischen Orten enthält.
Der Grund, warum das BAS diesen Sub-Korpus separat herausgibt liegt darin,
dass der Original-Korpus zahlreiche inhaltliche und formale Fehler aufweist
(s. CORRECTION Protokoll in Doku), welche die Anwendung in wissenschaftlichen
Analysen erschwert. Durch die neue Edition (mit freundlicher Genehmigung der
CLIPS Urheber) ist es möglich, dass Wissenschaftler
veröffentlichte Ergebnisse auf diesen Daten replizieren können.
Dieser Sub-Korpus enthält 3228 überprüfte und teilweise
reparierte Signalfiles (*.wav) mit je einem Dialogbeitrag, 3228 korrigierte Original-CLIPS
Annotationsdateien (*.acs, *.phn, *.std, *.wrd), 3228 BAS Partitur Format (BPF) files mit
den Annotationsebenen ORT, KAN and SAP (*.par), 3228 EMU database annotation files (*.vot, *.hlb),
sowie 3228 praat TextGrid files (*.TextGrid). Der Korpus enthält 30 Sprecher (jedes
der 15 Sprecherpaare sprechen zwei Dialoge) aus 15 verschiedenen Dialektregionen Italiens
(2000-2004).
Zahlen (Version 1.1):
- Anzahl Sprecher: 30
- Anzahl Aufnahmen: 3228
- Anzahl phonetischer Segmente: 104056
- File-Formate:
- RIFF WAVE WAV 22,05kHz, 16 bit
- Meta data: Sprecher- und Aufnahme-Protokoll (SpeechDat)
- CLIPS annotation (Transcriber)
- BPF (tiers ORT,KAN,SAP)
- Praat TextGrid
- Emu database: *.hlb, *.phonetic
- Segmentierungen: manuelle phonetische Segmentierung;
teilweise Segmentierung von closure + burst in Plosiven
- Distribution: DVD-R
Publikationen
Schiel F, Stevens M, Reichel U D, Cutugno F (2013): Machine Learning of Probabilistic Phonological Pronunciation Rules from the Italian CLIPS Corpus. In: Proc. of the Interspeech 2013, Lyon, France, 1414-1418.
Signal-Beispiele
Recording DGmtB04R_p2G#142
passandogli<ii> <sp>% trovandot0i% %il gelato sulla destra praticamente gli devi<ii> <sp< gli devi andare intorno passandogli dalla sinistra
Recording DGmtB04R_p1F#143
<vocal> gli devo% %andare% %intorno
Verfügbarkeit und Kosten
Ohne Einschränkungen verwendbar (ausgenommen Weitergabe an Dritte).
CLIPS_MT_MANUAL
1 DVD-R Iso 9660 + Versand
Wissenschaftlich EUR 255,65 (ELRA Mitglieder EUR 127,82) + USt
Kommerziell EUR 511,30 (ELRA Mitglieder EUR 255,64) + USt
Fragen und Bestellungen an:
Florian Schiel