BAS
Bayerisches Archiv für Sprachsignale
Siemens 1000 (Strange Corpus 7) - SI1000 (SC7)
Same page in english
Beschreibung
Dieser Korpus enthält je 1000 Sätze der Frankfurter Allgemeinen
gelesen von 10 Sprechern (5 männlich, 5 weiblich) im 'Diktier-Modus'.
Verwendungszweck dieses Korpus ist entweder das Training von automatischen
Diktiersystemen (SI1000) oder die Evaluierung von Methoden der
automatischen Sprecheradaption. Für letzteres wurde der gelesene Satzkorpus
in ein Adaptions- und ein Test-Set eingeteilt:
SC7 Adaptions-Set: Sätze 001 - 200
SC7 Test-Set: Sätze 201 - 1000
Adaptionstests sollten (egal ob inkrementell oder über das ganze Adaptions-Set) mit allen 10 Sprechern getrennt durchgeführt werden, um statistische
Ausreisser zu vermeiden.
(Natürlich darf der zugrundeliegende Spracherkenner weder mit dem
Adaptions- noch mit dem Test-Set dieses Korpus trainiert werden.)
Audiobeispiele
Sprecher CS - Satz 024
Tarifvereinbarungen , die eine bestimmte Preissteigerung vorwegnähmen , seien
unverantwortlich .
Sprecher PG - Satz 037
3. der Bundeshaushalt muß nicht nur
kurzfristig in Ordnung gebracht werden .
Verfügbarkeit und Kosten
Frei verfügbar.
Siemens 1000 - SI1000 (SC7)
5 CDROM Iso 9660 + Porto + Verpackung
EUR 1278.23 (ELRA Members 50% discount)
Fragen und Orders bitte an
Florian Schiel