Die VERBMOBIL CDROMs
Same page in english
Letztes Update dieser Seite: 14.04.99
Aktuelle Informationen über das Verbmobil Dialog Korpus auf CDROM
Derzeit sind bei der Universität München die folgenden Volumes
auf CDROM erhältlich:
-
CD VM 1.0.3 (16.12.93)
-
496608 KB 63 Dialogues 209 Appointm. 1840 Turns
History:
-
1.0 : only signal files, cut in turns, with push button
-
1.0.1 : Update : 6 missing turns in dialog N019K completed
-
1.0.2 : Update : Filenames in dialog N016K corrected (wrong turn numbering),
5 missing turns in dialog N010K completed
-
1.0.3 : Update : new edition of all signal files of Karlsruhe
-
1.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 2.0 (17.05.94)
-
399828 KB 81 Dialogues 227 Appointm. 1538 Turns
History:
-
2.0 : only signal files, cut in turns, with push button
-
2.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 3.0 (02.11.94)
-
284888 KB 45 Dialogues 184 Appointm. 1214 Turns
History:
-
3.0 : only signal files, cut in turns, with push button
-
3.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 4.0 (13.04.95)
-
390384 KB 72 Dialogues 181 Appointm. 1517 Turns
History:
-
4.0 : only signal files, cut in turns, with push button
-
4.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 5.0 (01.06.95)
-
624290 KB 101 Dialogues 256 Appointm. 2154 Turns
History:
-
5.0 : only signal files, cut in turns, with push button
-
5.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 6.0 (15.07.95)
-
576758 KB English 147 Dialogues (125 amerikanisch, 22 'denglish') 191 Appointm.
1828 Turns
History:
-
6.0 : only signal files, cut in turns, with push button
-
CD VM 7.0 (15.10.95)
-
532480 KB 68 Dialogues 238 Appointm. 1739 Turns
History:
-
7.0 : only signal files, cut in turns, with push button
-
7.0.1 : Update: some signal files from Bonn had no PhonDat 1 Header
-
7.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 8.0 (30.08.95)
-
483000 KB English 252 Dialogues 252 Appointm.
History:
-
8.0 : only signal files, cut in turns, with push button
-
8.1 : signal files, transliterations, BAS edition
-
8.1.1 : extended by 89 appointments
-
CD VM 12.0 (28.02.96)
-
598016 KB 207 Dialogues 207 Appointm. 2154 Turns
History:
-
12.0 : only signal files, cut in turns, with push button
-
12.1 : signal files with PhonDat 2 header (orthography + canonical transcript),
transliterations, BAS edition
-
CD VM 13.0 (11.07.96)
-
549219 KB 200 Dialogues (54 'denglisch', 146 amerikanisch) 200 Appointm.
1714 Turns
History:
-
13.0 : only signal files, cut in turns, with push button
-
CD VM 14.0 (01.10.96)
-
541529 KB 156 Dialogues 156 Appointm. 1891 Turns
History:
-
14.0 : signal files, cut in turns, with push button
-
CD VM S 1.0 (01.03.94)
-
580000 KB 26 Dialogues - 2227 Turns
History:
-
S 1.0 : free dialogs (Stereo Files STF) without button push
-
S 1.1 : transliterations, BAS edition
CD VM 15.0 (19.02.98)
-
652718 KB 57 Dialogues (19 close microphone, 19 room microphone, 19 telephone)
-
3117 Turns (1039 close, 1039 room, 1039 telephon) German, Scenario a.
CD VM 16.0 (12.12.98) (Originalausgabe VMJP1_4-CD1.0)
-
379453KB, 200 Dialogues, 3311 Turns
Achtung: Transliteration entspricht
nicht den VM1 oder VM2 Konventionen
CD VM 17.0 (22.12.98) (Originalausgabe VMJP2_4-CD1.0)
-
338349KB, 200 Dialogues, 2741 Turns
Achtung: Transliteration entspricht
nicht den VM1 oder VM2 Konventionen
CD VM 18.0 (23.12.98) (Originalausgabe VMJP3_4-CD1.0)
-
253809KB, 200 Dialogues, 2345 Turns
Achtung: Transliteration entspricht
nicht den VM1 oder VM2 Konventionen
CD VM 19.0 (23.12.98) (Originalausgabe VMJP4_4-CD1.0)
-
387793KB, 200 Dialogues, 2911 Turns
Achtung: Transliteration entspricht
nicht den VM1 oder VM2 Konventionen
CD VM 20.0 (23.04.98)
-
584723KB 48 Dialogues (10 close microphone, 28 room microphone, 10 telephone)
-
1947 Turns (398 close, 1151 room, 398 telephone) German, 3x10 Dialogues
Scenario a, 11 Dialogues Scenario b, 4 Files with backgroundnoise from
a business fair.
CD VM 21.0 (02.07.98)
-
550018KB 62 Dialogues (38 close microphone, 2 room microphone, 22 telephone)
-
2331 Turns (1527 close, 90 room, 714 telephone) German Scenario "A".
CD VM 22.0 (28.08.98)
-
439939KB 60 Dialogues (German Scenario "A": 28 close microphone,
27 telephone; German Scenario "B": 5 close microphone).
-
2004 Turns (915 close, 216 room, 873 telephone).
CD VM 23.0 (04.09.98)
-
648555KB, 28 Dialogues (all close microphone)
-
2459 Turns (all close) English Scenario "A"
-
update CD VM 23.0.1 (05.09.2000): 2727 resegmentierte turns
CD VM 24.0 (12.11.98)
-
511689KB, 58 Dialogues (36 close microphone, 22 mobile telephone)
-
2231 Turns (1454 close, 777 mobile telephone) German scenarios "A" (54
dialogues) and "B" (4 dialogues).
CD VM 25.0 (08.12.98)
-
470275KB, 10 Dialogues (all close microphone)
-
1654 Turns (all close) Japanese Scenario "A".
CD VM 26.0 (08.12.98)
-
524650KB, 16 Dialogues (all close microphone)
-
1319 Turns (all close) Japanese Scenario "A".
CD VM 27.0 (08.12.98)
-
565104KB, 24 Dialogues (all close microphone)
-
1149 Turns (all close) Japanese Scenario "A".
CD VM 28.0 (14.02.99)
-
573042KB, 28 Dialogues (all close microphone)
-
2409 Turns (all close) Pittsburgh Scenario "A".
CD VM 29.0 (19.07.99)
-
389287KB, 25 Dialogues (25 close microphone, 20 mobile telephone)
-
1870 Turns (1026 close, 844 telephone), Munich scenario "A" (21 Dialogues),
2 Bonn scenario "A", 2 Bonn scenario "B".
CD VM 30.0 (09.04.99)
-
637465KB, 58 Dialogues (33 close microphone, 25 mobile telephone)
-
3024 Turns (1718 close, 1306 telephone), German scenarios "A" (52 dialogues)
und "B" (6 dialogues)
CD VM 31.0 (16.06.99)
-
606693KB, 32 Dialogues (all close microphone)
-
2512 Turns (all close), Pittsburgh scenarios "A" (32 dialogues)
CD VM 32.0 (24.06.99)
-
601748KB, 17 multilinguale WOZ-Dialogues englisch/deutsch (all close microphone)
-
992 Turns (all close), Hamburg scenarios "A" (7 dialogues) und "B" (10
dialogues)
CD VM 33.0 (19.07.99)
-
554279KB, 25 japanische Dialoge (all close microphone)
-
1050 Turns (all close), Kyoto/ Tokyo scenarios "A"
CD VM 34.0 (19.07.99)
-
544947KB, 28 japanische Dialoge (all close microphone)
-
1437 Turns (all close), Kyoto/ Tokyo scenarios "A"
CD VM 35.0 (19.07.99)
-
609479KB, 27 japanische Dialoge (all close microphone)
-
1645 Turns (all close), Kyoto/ Tokyo scenarios "A"
CD VM 36.0 (23.07.99)
-
483199KB, 46 Dialogues (room microphone)
-
1523 Turns (all room), Munich scenario "A"
CD VM 37.0 (23.07.99)
-
490771KB, 34 Dialogues (room microphone)
-
1521 Turns (all room), Munich scenario "A"
CD VM 38.0 (15.09.99)
-
649693KB, 33 Dialogues (33 close microphone, 28 mobile telephone)
-
3483 Turns (1886 close, 1597 telephone), Munich scenario "A"
CD VM 39.0 (15.09.99)
-
585812KB, 2475 Turns (1483 close, 992 telephone)
-
31 Dialogues, multilingual deutsch-englisch, End-2-End-Evaluation 12/98
-
20 Dialogues, Munich scenario "A" (close microphone, mobile telephone)
-
8 Dialogues, Bonn scenario "B" (close microphone)
CD VM 40.0 (15.09.99)
-
437346KB, 33 Dialogues (room microphone)
-
1378 Turns (all room), Munich scenario "A"
CD VM 41.0 (15.09.99)
-
562141KB, 32 Dialogues (room microphone)
-
1977 Turns (all room), Munich scenario "A"
CD VM 42.0 (17.09.99)
-
442470KB, 20 Dialogues (close microphone)
-
1874 Turns (all close), Pittsburgh scenario "A"
CD VM 43.0 (17.09.99)
-
254922KB, 11 Dialogues (close microphone)
-
633 Turns (all close), Pittsburgh scenario "A"
CD VM 44.0 (13.12.99)
-
383833KB, 19 Dialogues (close microphone)
-
920 Turns (all close), Tokyo/ Kyoto scenario "A"
CD VM 45.0 (13.12.99)
-
419471KB, 21 Dialogues (close micophone)
-
1293 Turns (all close), Tokyo/ Kyoto scenario "A"
CD VM 46.0 (21.09.2000)
-
591279KB, 11 multilingual Dialogues japanese/ german
-
alle Nahaufnahmen, ausser Dialogues 234-238, Kanal 4, mit Raummikrophon
-
607 Turns, 9 Hamburg scenario "A", 2 Hamburg scenario "B"
CD VM 47.0 (21.06.2000)
-
552449KB, multilinguale WOZ-Dialogues englisch/ deutsch (close
microphone)
-
902 Turns (all close), Hamburg scenario "A"
CD VM 48.0 (05.01.2000)
-
569647KB, 28 Dialogues (28 close microphone, 27 telephone microphone)
2996 Turns (1520 close, 1476 telephone), Munich scenario "A"
CD VM 49.0 (10.01.2000)
-
396515KB, 24 Dialogues
-
1917 Turns (1237 close, 680 telephone), 12 Munich scenario "A" (close/
telephone microphone), 12 Bonn scenario "B" (close microphone)
CD VM 50.0 (10.01.2000)
-
155216KB, 8 Dialogues (close microphone)
-
679 Turns (all close), Pittsburgh scenario "A"
CD VM 51.0 (03.07.2000)
-
569647KB, 15 Dialogues englisch/ deutsch (close microphone)
-
873 Turns (all close), 11 Hamburg scenario "A", 4 Hamburg scenario "B"
CD VM 52.0 (10.08.2000)
-
494372KB, 13 Dialogues englisch/ deutsch (close microphone)
-
728 Turns (all close), 1 Hamburg scenario "A", 12 Hamburg scenario "B"
CD VM 53.0 (10.08.2000)
-
414859KB, 16 Dialogues deutsch/ deutsch
-
1771 Turns (all close), 8 Bonn scenario "B" (close microphone), 8
München scenario "A" (close/ telephone/ room microphone)
CD VM 54.0 (10.08.2000)
-
572253KB, nur Raumsignalaufnahmen der CD48 und CD49
CD VM 55.0 (29.08.2000)
-
349584KB, 11 Dialogues englisch/ deutsch (close microphone)
-
518 Turns (all close), 7 Hamburg scenario "A", 4 Hamburg scenario "B"
CD VM 56.0 (05.09.2000)
-
363621KB, 12 Dialogues englisch/ deutsch (close microphone)
-
620 Turns (all close), 7 Hamburg scenario "A", 5 Hamburg scenario "B"
CD VM 57.0 (21.09.2000)
-
631317KB, 11 multilingual Dialogues japanisch/ deutsch (close
microphone)
-
702 Turns, 8 Hamburg scenario "A", 3 Hamburg scenario "B"
CD VM 58.0 (21.09.2000)
-
400781KB, 7 multilingual Dialogues japanisch/ deutsch (close
microphone)
-
421 Turns, 4 Hamburg scenario "A", 3 Hamburg scenario "B"
CD VM 59.0 (21.09.2000)
-
366378KB, 7 multilingual Dialogues japanisch/ deutsch (close microphone)
-
354 Turns, 7 Hamburg scenario "B"
CD VM 60.0 (15.09.2000)
-
Testdaten fuer die erste abschließende Evaluation des japanischen
Spracherkenners
CD VM 61.0 (15.09.2000)
-
372601KB, 19 Dialogues japanisch/ japanisch (all close)
-
946 Turns, main scenario
CD VM 62.0 (15.09.2000)
-
455845 KB, 20 Dialoques japanisch/ japanisch (all close)
-
981 Turns, main scenario
CD VM 63.0 (21.09.2000)
-
620066KB, Erlangener Emotionsdaten
CD VM 64.0 (21.09.2000)
-
615348KB, Erlangener Emotionsdaten
CD VM 65.0 (21.09.2000)
-
637937KB, Erlangener Emotionsdaten
Bitte beachten Sie, daß nur die jeweils letzte Version eines
Volumes verwendet werden sollte (um z.B. Abweichungen zu den Transliterationen
oder der Sprecher-Datenbasis zu vermeiden). Sollten Sie im Besitz einer
CDROM mit niedrigerer Versionsnummer als oben angegeben sein, bestellen
Sie bitte die letzte Version bzw. laden die Änderungen zur letzten
Version von folgendem FTP
Server:
host: ftp.phonetik.uni-muenchen.de
user: anonymous
directory: /pub/err_cdrom-*
Jedes Volume ist auf einer ISO 9660 (High Sierra File System)
CDROM gespeichert, welche auf allen Plattformen gelesen werden kann.
Die zugehörigen Transliterationen laden Sie bitte
vom offiziellen VERBMOBIL FTP Server in Saarbrücken (ftp.dfki.uni-sb.de)
im Unterverzeichnis /FTP-SERVER/vm-daten/trl.
Beachten Sie bitte, daß diese Files im ungefähren Abstand
von 3 Monaten mit Fehler-Updates versehen werden. Diese Fehler-Updates
sind im File trl-history.txt
im selben Unterverzeichnis des Servers dokumentiert.
Das Handbuch zur Transliteration wurde von IPDS
Kiel (VERBMOBIL techdok-11-94.ps) erstellt.
Für Verbmobil II gilt die neue Version der Transliterationskonventionen.
Informationen zu den einzelnen Aufnahmen finden Sie in der Verbmobil
Sprecherdatenbasis (auch auf dem offiziellen Verbmobil FTP Server erhältlich,
s.o.).
Software zum Lesen/Schreiben des PhonDat Formats, zur Transformation
in NIST und umgekehrt, zur Erzeugung von PhonDat-Format aus 'raw files',
zum Abspielen auf SunOS und LINUX befindet sich auf jeder CD. Die jeweils
letzte Version der Software kann unter der folgenden Adresse
geladen werden:
host: ftp.phonetik.uni-muenchen.de
user: anonymous
dir: /pub/software/phondat
Die VERBMOBIL Volumes werden nach ihrer Ausgabe für ein Jahr
gesperrt, innerhalb dessen sie nur an offizielle VM Partner weitergegeben
werden dürfen. Nach dieser Sperrfrist werden die Volumes an die ELRA
(European Language Resources Agency) weitergegeben und können außerdem
von Jedermann über das Bayerische
Archiv für Sprachsignale (BAS) in München bezogen werden.
Bestellungen und Fragen von Verbmobil Partnern richten Sie bitte
an
Bestellungen und Fragen von anderen Institutionen richten Sie
bitte an
The VERBMOBIL
Project
Florian
Schiel