BAS
Bayerisches Archiv für Sprachsignale
SmartWeb Video Corpus - SVC
Letzter Update: 2014-03-04 - same page in english
Beschreibung
Dieser Korpus enthält 99 Aufzeichnungen mit jeweils einem
Mensch-Mensch-Maschine Dialog: Ein Sprecher interagiert gleichzeitig
mit dem SmartWeb-System (via UMTS-SmartPhone) und mit seinem
menschlichen Partner.
Die Sprecher verwenden ein PDA gestütztes, mobiles System (SmartWeb)
für natürlichsprachliche Anfragen an das WWW in natürlicher
Umgebung (Büro, Strasse, Lobby, etc.).
Es wurden der über UMTS-Kanal gesendete Kanal des Bluetooth-Headsets,
das Gesichts-Video sowie ein Ansteckmikro in hoher Qualität
aufgezeichnet. Nur einer der beiden Sprecher wurde aufgezeichnet.
Das Sprachsignal wurde einmal automatisch (vom Promptserver) und ein zweites
Mal manuell in Turns segmentiert und nach Verbmobil-Standard verschriftet.
Das Videosignal wurde manuell in OnView / OffView Sequenzen gelabelt; ein
Teil des Video-Korpus wurde zudem für die Gesichtsdetection manuell
segmentiert.
Ziel dieses Korpus ist es einerseits realistische multi-modale
(Sprache + Video) Daten für die Fokusbestimmung und andererseits
möglichst umfangreiche und vielfältige OffTalk Sequenzen zu erzeugen.
- Anzahl Dialoge/Sprecher: 99
- Gesamtanzahl segmentierte Turns: 2218
- Dauer gesamt: 971min
- Vokabular (Anzahl unterschiedlicher Wort-Tokens): 1643
- Formate:
- Ansteckmikro: WAV 44,1kHz, 16 bit
- Bluetooth/UMTS-Kanal: ALAW 8kHz 8bit
- Video: 176x144, 24bpp, 15fps, 3GPP + MPEG1
- Verbmobil Transliteration (TRS), BAS Partitur Format (BPF), ATLAS Annotation Graph (XML)
- Meta-Daten: Sprecher- und Recording-Protokoll (XML)
- Segmentierung: automatische Segmentierung in Anfragen durch den Server + manuelle Segmentierung in Turns, OffTalk-Labelling, OffView-Labelling, Gesichtsdetektion-Labelling (teilweise)
- Distribution: 5 DVD-R
Publikation: Schiel, F., Mögele, H. (2008). Talking and Looking: the SmartWeb Multimodal Interaction Corpus. In: Proc. of LREC 2008, Marrakesch, Marokko.
Audiobeispiele
Recording i067/man-0000rec-110 Bluetooth Headset UMTS
bis <"ah> <h"as> wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmitt= <PP> <h"as> <P> bis% um wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmittel ?
Recording i067/man-0000rec-110 Collar Microphone High Quality (no UMTS transmission)
bis <"ah> <h"as> wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmitt= <PP> <h"as> <P> bis% um wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmittel ?
Videobeispiele
Recording i097.mpg Männlich 32 Jahre, Innenaufnahme, Bluetooth Headset UMTS
Transkript i097.trl
Recording Protocol i097.rpr
Speaker Protocol AJAW.spr
Recording i100.mpg Weiblich 25 Jahre mit Brille, Innenaufnahme, Bluetooth Headset UMTS
Transkript i100.trl
Recording Protocol i100.rpr
Speaker Protocol APDW.spr
Verfügbarkeit und Kosten
Ohne Einschränkung verwendbar (außer der Weiterverbreitung an Dritte).
SmartWeb Video Corpus - SVC
6 DVD-R Iso 9660 + Porto + Verpackung
Scientific EUR 1.275,00 (ELRA Members EUR 635,00) + VAT
Commercial EUR 2.275,00 (ELRA Members EUR 1.635,00) + VAT
Fragen und Orders bitte an
Florian Schiel