Dieses Projekt wird gefördert vom Bundesministerium für Bildung und Forschung
 


englische Version

Link zum CeBIT-Flyer

 
BITS


BAS Infrastrukturen für Technische Sprachsignalverarbeitung



Was ist und macht BITS ?

 
BAS Infrastrukturen für Technische Sprachverarbeitung ist eine Infrastrukturmaßnahme zur Schaffung einer wissenschaftlich und ingenieurtechnisch fundierten und allgemein zugänglichen Plattform für Ressourcen gesprochener deutscher Sprache innerhalb des Kompetenznetzwerkes für Sprachtechnologie unter der Federführung von COLLATE (DFKI Saarbrücken), die für jeden privaten Benutzer zugänglich sein wird. BAS ist als Teil der Ludwig-Maxilimians-Universität München eine gemeinnützige Organisation zur Forschung auf dem Sektor der Sprachverarbeitung. Mit BITS wird ein Zentrum geschaffen, das sowohl rein wissenschaftliche als auch entwicklungstechnische Anstrengungen im Bereich der maschinellen Verarbeitung gesprochener Sprache innerhalb Deutschlands mit der entsprechenden Infrastruktur und strukturiert aufbereitetem Knowhow soweit unterstützt, daß die bisher vorhandene Parallelarbeit im Bereich der empirischen Spracherhebung entfallen wird. Das gesamte Projekt soll etwa 4 Jahre laufen. In dieser Zeit soll eine Basisplattform für weitere, größtenteils fremdfinanzierte Projekte geschaffen werden.


Einteilung in 9 Teilprojekte:
(Dauer jedes Teilprojektes nach Beginn)

 
Die wissenschaftliche und technische Zielsetzung gliedert sich in 9 thematisch abgegrenzte Teilprojekte:
 
Projekt 1:
Methodologie zur Produktion von wiederverwendbaren Korpora (Beginn 0, läuft bis 6. Monat)
[Erarbeitung allgemeiner Design-Prinzipien auch für zukünftige Projekte]
Bisher waren die sehr spezifischen Sprachressourcen immer schnell veraltet und aufgrund ihrer hohen Spezialisierung nicht auf zukünftige Applikationen portierbar.  Deshalb sollen  in diesem  Teilprojekt Design-Prinzipien erarbeitet werden, die Korpora auch für andere zukünftige Aufgabenstellungen verwendbar machen.  Der Aufwand wird sich nur gering erhöhen, indem sich der Umfang des Materials für jeden einzelnen Sprecher etwas erweitern wird.
 

Projekt 2:
Methodologie zur technischen und inhaltlichen Validierung (Beginn ab 0, läuft bis 6. Monat)
[Erarbeitung einer Definition von Checklisten/Prüfverfahren und Entwurf eines Gütesiegels zur Gesamtbeurteilung einer Ressource]
In Anlehnung an die Ergebnisse aus Projekt 1 werden die genannten Verfahren es dem Laien ermöglichen, Korpora mit unterschiedlicher formaler und inhaltlicher Qualität für eigene Bedürfnisse zu beurteilen. Die Prüfergebnisse für im BAS archivierte Korpora sollen anhand der erarbeiteten Methoden erstellt und im BAS-Katalog veröffentlicht werden.
 

Projekt 3:
Validierung von Sprachdaten über das Internet (Beginn ab 0, bis 18. Monat)
[Entwicklung von Werkzeugen zur Durchführung von Annotationen dezentral über das Internet]
Die Annotation beansprucht in der Regel den größten Teil des für die Korpusproduktion angesetzten Budgets. Um diesen Prozess so einfach und zeitsparend wie möglich zu gestalten, werden neuerdings Arbeitsschritte plattformabhängig und dezentral über das Internet durchgeführt (wie dies bereits am BAS mit der Entwicklung von WWWTranskribe und für das deutsche SpeechDat-Projekt umgesetzt wurde). In Projekt 3 werden Werkzeuge entwickelt und zur Verfügung gestellt werden, die es ermöglichen, Annotationen auf verschiedenem linguistischen und technischen Niveau dezentral über das Internet durchzuführen, wobei das Ergebnis einer Annotation sofort zur weiteren Verarbeitung an den Server weitervermittelt wird.
 

Projekt 4:
Erhebung von Sprachdaten über das Internet (Beginn ab 0, läuft bis 24. Monat)
[Neue Methode zur flächendeckenden Erhebung von direkten Aufnahmen durch Client-Software am privaten Rechner ]
Zur flächendeckenden Erhebung von  direkten Aufnahmen wird eine neue Client-Software an privaten Rechnern installiert und die gewonnenen Aufnahmen anschließend über das Internet an den Zentralrechner der Datensammlung übermittelt. Die Sprecher erhalten ein geeignetes Mikrophon und melden sich bei einem WWW-Server an, der sie Schritt für Schritt durch die Aufnahme führt. In Form von Datenpaketen werden temporäre Signaldateien an den Server übermittelt. Dies Verfahren ermöglicht, Sprachsignale mit hoher Qualität unter realistischen Umweltbedingungen im gesamten Sprachraum zu erheben, wobei die teure Versendung von 'Prompt Sheets entfällt, da die Sprachprompts direkt über das Web geschickt werden. Die Verwaltung der Sprecher läuft über eine zentrale Stelle, um jederzeit den aktuellen Stand ermitteln zu können.
 

Projekt 5:
Neubewertung des BAS-Katalogs (Beginn ab 18., läuft bis 48. Monat)
[Systematische Neubearbeitung der bereits in BAS enthaltenen Sprachressourcen  nach in TP2 erarbeiteten Prinzipien und Veröffentlichung im BAS-Katalog]
Für den Anwender ist es schwer zu beurteilen, inwieweit eine spezielle Sprachressource für seine speziellen Zwecke geeignet ist. In Teilphase 5 soll daher nach in Testphase 2 erarbeiteten Prinzipien eine systematische Neubewertung der bereits im BAS enthaltenen Sprachressourcen (auch Sprachressourcen, die nicht selbst von BAS produziert wurden) durchgeführt und die Ergebnisse daraus im BAS-Katalog veröffentlicht werden.
 

Projekt 6:
Automatische Analyse von Sprachkorpora (Beginn ab 18., läuft bis 48. Monat)
[Entwicklung neuer Verfahren und Werkzeuge für die automatische/halbautomatische  Erstellung von Annotationen bzw. Segmentierungen]
Der Wert eines Korpus ist im wesentlichen durch seine Meta-Information (z.B. Dokumentation, Sprecherprofile, Aufnahme-, Annotations- und Validierungs-Protokolle, Segmentationsinformation) bestimmt, weshalb erhebliche finanzielle Mittel für die Erstellung manueller Annotationen aufgewandt werden müssen. In Teilphase 6 sollen daher aufbauend auf dem 'Münchner Automatischen Segmetationssystem' (MAUS) neue Verfahren und Werkzeuge entwickelt werden, die eine automatische bzw. halbautomatische Erstellung von Annotationen bzw. Segmentierungen ermöglichen. Vor allem soll dabei das bestehende MAUS-Prinzip und die vollautomatische Erstverschriftung bzw. die Verifikation von gelesenen Sprachsignalen weiterentwickelt werden. Die Ergebnisse werden danach im BAS Partitur Format erstellt, um eine reibungslose Integration in bestehende Datenbestände zu gewährleisten.
 

Projekt 7:
Bedarfsstudie für technische Sprachanwendungen (Beginn ab 6., läuft bis 18. Monat)
[Befragung aller einschlägigen deutschen Firmen  und Experten  zur Einschätzung  des Bedarfs an deutschen Sprachressourcen in den nächsten 5-15 Jahren]
In Kooperation mit industriellen Partnern des Kompetenznetzwerkes für Sprachtechnologie soll durch Befragung von einschlägigen deutschen Firmen und Experten eine Einschätzung des Bedarfs an deutschen Sprachressourcen für die nächsten 5, 10 und und 15 Jahre und die Ausarbeitung eines Empfehlungskatalogs mit einem Ranking für benötigte Sprachkorpora erstellt und über das BAS veröffentlicht werden.
 

Projekt 8:
Korpus für Sprachsynthese (Beginn ab 6., läuft bis 48. Monat)
[Entwurf, Annotation und Segmentierung eines allgemein verfügbaren Korpus mit professionellen Sprechern  zur konkatenativen Sprachsynthese]
Korpora mit professionellen Sprechern sind derzeit für das Deutsche nicht lizenzfrei zugänglich. Deshalb soll zum Zweck einer konkatenativen Sprachsynthese ein allgemein verfügbarerKorpus mit professionellen Stimmen erstellt werden, der KMU's und Forschungsinstitute in diesem Bereich eine kompetitive Arbeit ermöglicht. Hauptziel ist der Entwurf eines breit verwendbaren Synthesekorpus durch die Aufnahme von geschulten Sprechern und die anschließende Annotation bzw. Segmentierung der Signale auf  mehreren Ebenen.
 

 Projekt 9:
Archiv für Sprache von Jugendlichen (Beginn ab 24., läuft bis 48. Monat)
[Erweiterung des Korpus Regional Variants of German mit der Sprache von Kindern und Jugendlichen aus allen deutschen Sprachregionen]
Derzeit existieren im Deutschen keine öffentlich zugänglichen Sprachkorpora von Kindern  und Jugendlichen, obwohl diese zentrale Zielgruppen industrieller Anwendungen darstellen. In dieser Projektphase wird eine gezielte Erweiterung des bereits existierenden Korpus Regional Variants of German  mit der Sprache von Kindern  und Jugendlichen (RVG-J)  in enger Zusammenarbeit mit wissenschaftlichen Gruppen des Spracherwerbs (z.B. CHILDES-Projekt) angestrebt. RVG-J ist eine Erweiterung in drei Hinsichten: Erweiterung durch Stimmen junger Leute aus allen Sprachregionen und Erweiterung durch anwendungsnähere Äußerungen (z.B. Telefonnummern, Ansagetexte für Anrufbeantworter usw.). Dafür sollen Institute in den jeweiligen Regionen gewonnen werden, die diese Datensammlung durchführen und im Gegenzug dazu technische Unterstützung und Anteil an späteren Lizenzeinnahmen erhalten.
 

Kontaktpersonen:

1. Kompetenznetzwerk für Sprachtechnologie (COLLATE): Prof. Wahlster, Prof. Uszkoreit - Univ.   Saarbrücken

2. BITS: Dr. Florian Schiel, , - Univ. München

3. BAS: 
 
 
 
 
 


eingerichtet von: Angela Baumann am 20.03.02