BAS
Bayerisches Archiv für Sprachsignale
Aussprache-Lexikon PHONOLEX

Same page in english

Letzter Update dieser Seite: 19.09.2013


Allgemeines

PHONOLEX ist das Ergebnis einer Zusammenarbeit des DFKI Saarbrücken, Computational Linguistics Lab, der Universität Leipzig und des Bayerischen Archivs für Sprachsignale in München.
Es besteht aus einer einfachen Vollformenliste des Deutschen mit folgenden Einträgen:


Struktur

Das PHONOLEX ist derzeit als einfaches ASCII File und als XML-Version verfügbar. Die einzelnen Einträge der ASCII-Liste sind in ASCII-Sortierung aufgelistet.

file       ->  item 'NL'
               [ item 'NL' ]
               ...

item       ->  orthography 
               info
               canonic_pronunciation 
               empiricial_pronunciation_list 
               '*' 

orthography  ->  German Orthography with LateX Umlauts

info  ->  TAB-seperated list of keys:string

canonic_pronunciation  ->  word_form 

empirical_pronunciation_list  ->  
                   word_form TAB counter TAB corpus TAB type
                   ...

word_form  ->  string of extended SAM-PA

counter  ->  Integer

corpus  ->  String 

type  ->  String


Beispiel

"Athanylylidenes
CL:nom  OR:sb
QE:tanylyli:d@n@s
*
"Ather
CL:nom  GE:m    OR:lg
QE:t6
*
"Ather
CL:nom  OR:sb
QE:t6
*
"Ather
OR:vm   TP:manu
Q'E:t6
QE:t6   1       VM      MAUS
*

Zusätzlich zur Basisliste enthält das PHONOLEX Paket noch eine Version in XML und zwei Auszüge:


Bekannte Fehler

Keine Aussprache-Liste ist fehlerlos, auch PHONOLEX bildet da keine Ausnahme. Wir hoffen aber, in der nächsten Zeit durch kontinuierliche Verbesserung zumindest die regelmäßigen Fehler sowohl in der Orthographie als auch in der Aussprache ausmerzen zu können. Außerdem erwarten wir ein kontinuierliches Anwachsen der Wortliste.

Bekannte Fehler (nur TP:ptra):

Auszug aus aktueller Korpus-Dokumentation

Tabellarische Merkmalsliste aller Quellen


Historie


Verfügbarkeit

Kopien der aktuellen Version von PHONOLEX können über das BAS bezogen werden. Dazu ist der einmalige Erwerb einer Benutzer-Lizenz erforderlich.
Die Benutzer-Lizenz ermächtigt zum Gebrauch des PHONOLEX für kommerzielle und/oder rein wissenschaftliche Zwecke (verschiedene Lizenzen). Außerdem berechtigt der Besitz der Lizenz zum kostenlosen Bezug weiterer verbesserter Versionen von PHONOLEX, sobald diese vom DFKI und BAS als verfügbar erklärt werden.
Sie berechtigt nicht zur Weitergabe an Dritte, auch nicht in Auszügen oder in modifizierter/erweiterter Form. Eine Vermarktung der Liste in direkter Form ist nicht gestattet.
Außerdem verpflichtet sich der Benutzer des PHONOLEX alle von ihm aufgefundenen, vermeintlichen Fehler im PHONOLEX an das BAS zu melden. Auf diese Weise soll schrittweise eine weitgehend fehlerfreie Aussprache-Liste entstehen.
Alle Copyrights verbleiben beim DFKI, UL und BAS.
Mit dem Erwerb der Lizenz akzeptiert der Benutzer alle obigen Bedingungen.

Kosten

PHONOLEX - Auslieferung per CDROM, Update-Service
Lizenz wissenschaftlich EUR 1030.25
Lizenz wissenschaftlich ELRA Mitglieder EUR 631.45
Lizenz kommerziell EUR 6081.82
Lizenz kommerziell ELRA Mitglieder EUR 3423.10

Bestellungen oder Fragen senden Sie bitte an folgende Adresse:

.

Voraussetzung für die Ausführung der Bestellung ist die Übersendung der editierten und unterschriebenen Nutzungserklärung per Post oder Fax an das BAS.


Copyright © 1996-2011 Bayerisches Archiv für Sprachsignale, Universität Müchen, Deutsches Forschungszentrum für künstliche Intelligenz, Saarbrücken, Universität Leipzig
This page and all other pages with the initial 'BAS' or 'Bas' in the filename may be copied, printed and distributed to other parties, under the condition that the pages are distributed as shown here. Parts of pages or extended pages may not be distributed further without permission of the BAS.


Florian Schiel