BAS
Bayerisches Archiv für Sprachsignale
Siemens 1000 (Strange Corpus 7) - SI1000 (SC7)

Same page in english

Beschreibung

Dieser Korpus enthält je 1000 Sätze der Frankfurter Allgemeinen gelesen von 10 Sprechern (5 männlich, 5 weiblich) im 'Diktier-Modus'. Verwendungszweck dieses Korpus ist entweder das Training von automatischen Diktiersystemen (SI1000) oder die Evaluierung von Methoden der automatischen Sprecheradaption. Für letzteres wurde der gelesene Satzkorpus in ein Adaptions- und ein Test-Set eingeteilt:

SC7 Adaptions-Set: Sätze 001 - 200
SC7 Test-Set: Sätze 201 - 1000

Adaptionstests sollten (egal ob inkrementell oder über das ganze Adaptions-Set) mit allen 10 Sprechern getrennt durchgeführt werden, um statistische Ausreisser zu vermeiden. (Natürlich darf der zugrundeliegende Spracherkenner weder mit dem Adaptions- noch mit dem Test-Set dieses Korpus trainiert werden.)

Auszug aus Korpus Dokumentation

Inhalt des Korpus

Audiobeispiele

Sprecher CS - Satz 024
Tarifvereinbarungen , die eine bestimmte Preissteigerung vorwegnähmen , seien unverantwortlich .
Sprecher PG - Satz 037
3. der Bundeshaushalt muß nicht nur kurzfristig in Ordnung gebracht werden .

Revalidierungsreport

Verfügbarkeit und Kosten

Frei verfügbar.
Siemens 1000 - SI1000 (SC7)
5 CDROM Iso 9660 + Porto + Verpackung
EUR 1278.23 (ELRA Members 50% discount) Fragen und Orders bitte an
Florian Schiel