BAS
Bayerisches Archiv für Sprachsignale
SmartKom - SKP
Letzte Änderung 2012-02-29 - same page in english
Allgemeines
Das SmartKom-Korpus wurde in den Jahren 2000-2003 am BAS im Rahmen
des BMB+F-Leitprojekts SmartKom
produziert. Das Korpus enthält 448 multimodale Aufnahmen ('Sessions') in einem
Wizard-of-Oz-Szenario von 224 Versuchspersonen. Nähere Informationen
zur Korpusproduktion finden sich hier; eine Übersicht über den gesamten
Korpus wurde auf der LREC 2002 veröffentlicht.
Die Release SKP enthält Aufnahmen im technischen Setup ('scenario')
SmartKom Public. Dabei handelt es sich um eine öffentlich zugängliche
Kommunikationszelle (vergleichbar mit einer traditionellen Telefonzelle).
Naive Versuchspersonen, die nicht wussten, dass es sich um eine Simulation
handelt, benutzten diese Zelle zweimal für jeweils 4,5 Minuten, während
derer sie eine Aufgabe aus einer bestimmten Domäne zu lösen hatten; die VPs
waren mit dem System allein gelassen und hatten nur eine minimale
Instruktion: Es wurde lediglich
mitgeteilt, dass das System Sprache und 2D-Gesten
verstehe und auch das Gesicht erkennen und deuten könne.
Wichtigste technische Daten des Release SKP
- Technisches Setup: Public (Szenario)
- Hauptdomäne 'Cinema'; Nebendomäne 'Restaurant' (Domain)
- Hauptdomäne 'Fax'; Nebendomäne 'Telephone, E-Mail' (Domain)
- 86 Versuchspersonen
- 172 Aufnahme-Sessions; Umfang: 580 GByte
- Aufgenommene Modalitäten:
- Audio in 10 Kanälen
- Video Gesichtsfeld
- Video Oberkörper von links
- Infrarot-Video des Displaybereichs von oben (zur Erfassung
der 2D-Gestik)
- Video des graphischen Displays (Beamers)
- Koordinaten Graphiktableau
- Koordinaten SIVIT-Einheit
- Annotationen:
- Transliteration
- 2D Gestik
- User-State in drei verschiedenen Modalitäten
- Turn-Segmentierung
- Volle Dokumentation, TechDoks und Veröffentlichungen
- Alle Annotationen kompatibel zum 'BAS Partitur Format' (BPF)
Original READMEs
Aufnahme-Sessions : Übersicht
Diese Tabelle enthält eine Übersicht über alle SmartKom Aufnahme-Sessions.
Pro Session ist genau eine Zeile mit 35 Spalten enthalten.
Diese enthalten Angaben
über Session-Nummer und Volume-Nummer (Spalte 1-2), aufgenommene Modalitäten
(Spalte 3-20), Annotationen (Spalte 21-26) sowie einige Merkmale
der beteiligten Versuchsperson.
Nicht alle Aufnahme-Sessions enthalten alle Modalitäten und/oder Annotationen;
die obige Tabelle soll helfen, die Aufnahme-Sessions zu finden, die für
einen bestimmten Zweck relevant sind.
Verfügbarkeit und Distributionsgebühren
Das SmartKom Korpus wurde mit öffentlichen Geldern und Mitteln des BAS
finanziert und ist daher lizenzfrei verfügbar. Eine Weitergabe des Korpus
oder auch Teilen oder Auszügen davon an Dritte ist nicht gestattet. Ansonsten
unterliegt die Nutzung keinerlei Beschränkungen
Das Korpus ist in Volumes gegliedert, wobei i.A. jedes Volume eine
Aufnahme-Session enthält (ca. 4,3 - 4,7 GByte). Zur Auswahl individueller
Volumes verwenden Sie bitte die o.g. Übersichtstabelle.
Bei individueller Bestellung
einzelner Volumes beträgt die Gebühr für ein Volume 1 BAS Distributionsgebühr:
SmartKom Single Volume
1 DVD-5 UDF + Porto + Verpackung
EUR 255,65 (ELRA Members 50% discount)
Die Gebühr für das gesamte Release SKP auf USB Harddisc beträgt:
SmartKom SKP
1 USB HD + Porto + Verpackung
EUR 4.500,- (ELRA Members 3.000,-)
Es ist problemlos möglich, nur Auszüge des Korpus zu bestellen. Z.B. alle
Aufnahmen des frontalen Videos (Gesicht) zusammen mit den User-State
Labelungen oder nur Audio-Signale zusammen mit Transliteration.
Die Distributionsgebühr richtet sich in diesem Falle
nach dem Umfang der Daten (1 BAS Distributionsgebühr pro gebrannte DVD-5).
Beachten Sie auch die spezielle Ausgabe SKAUDIO nur mit Sprachaufnahmen.
Fragen und Orders bitte an
Florian Schiel