BAS
Bayerisches Archiv für Sprachsignale
SmartWeb Video Corpus - SVC

Letzter Update: 2014-03-04 - same page in english

Beschreibung

Dieser Korpus enthält 99 Aufzeichnungen mit jeweils einem Mensch-Mensch-Maschine Dialog: Ein Sprecher interagiert gleichzeitig mit dem SmartWeb-System (via UMTS-SmartPhone) und mit seinem menschlichen Partner.
Die Sprecher verwenden ein PDA gestütztes, mobiles System (SmartWeb) für natürlichsprachliche Anfragen an das WWW in natürlicher Umgebung (Büro, Strasse, Lobby, etc.).
Es wurden der über UMTS-Kanal gesendete Kanal des Bluetooth-Headsets, das Gesichts-Video sowie ein Ansteckmikro in hoher Qualität aufgezeichnet. Nur einer der beiden Sprecher wurde aufgezeichnet. Das Sprachsignal wurde einmal automatisch (vom Promptserver) und ein zweites Mal manuell in Turns segmentiert und nach Verbmobil-Standard verschriftet. Das Videosignal wurde manuell in OnView / OffView Sequenzen gelabelt; ein Teil des Video-Korpus wurde zudem für die Gesichtsdetection manuell segmentiert.

Ziel dieses Korpus ist es einerseits realistische multi-modale (Sprache + Video) Daten für die Fokusbestimmung und andererseits möglichst umfangreiche und vielfältige OffTalk Sequenzen zu erzeugen.

Korpus Dokumentation (für gesamten SW-Korpus)

Publikation: Schiel, F., Mögele, H. (2008). Talking and Looking: the SmartWeb Multimodal Interaction Corpus. In: Proc. of LREC 2008, Marrakesch, Marokko.

Dokumentation Addendum DVD SVC (zusätzliche Video-Annotation)

Audiobeispiele

Recording i067/man-0000rec-110 Bluetooth Headset UMTS
bis <"ah> <h"as> wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmitt= <PP> <h"as> <P> bis% um wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmittel ?
Recording i067/man-0000rec-110 Collar Microphone High Quality (no UMTS transmission)
bis <"ah> <h"as> wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmitt= <PP> <h"as> <P> bis% um wieviel Uhr fahren denn in der Nacht die "offentlichen Verkehrsmittel ?

Videobeispiele

Recording i097.mpg Männlich 32 Jahre, Innenaufnahme, Bluetooth Headset UMTS
Transkript i097.trl
Recording Protocol i097.rpr
Speaker Protocol AJAW.spr

Recording i100.mpg Weiblich 25 Jahre mit Brille, Innenaufnahme, Bluetooth Headset UMTS
Transkript i100.trl
Recording Protocol i100.rpr
Speaker Protocol APDW.spr

Verfügbarkeit und Kosten

Ohne Einschränkung verwendbar (außer der Weiterverbreitung an Dritte).
SmartWeb Video Corpus - SVC
6 DVD-R Iso 9660 + Porto + Verpackung
Scientific EUR 1.275,00 (ELRA Members EUR 635,00) + VAT
Commercial EUR 2.275,00 (ELRA Members EUR 1.635,00) + VAT

Fragen und Orders bitte an


Florian Schiel