Laden Sie die folgenden Packages und Data Frames:
library(tidyverse)
library(gridExtra)
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
clara = read.table(file.path(url, "clara.txt"), stringsAsFactors = T)
preasp = read.table(file.path(url, "preasp.txt"), stringsAsFactors = T)
vdata = read.table(file.path(url, "vdata.txt"), stringsAsFactors = T)
asp = read.table(file.path(url, "asp.df.txt"), stringsAsFactors = T)
glottal = read.table(file.path(url, "glottal.txt"), stringsAsFactors = T)
dg = read.table(file.path(url, "dg.txt"), stringsAsFactors = T)
franken = read.table(file.path(url, "franken.txt"), stringsAsFactors = T)
h.df = read.table(file.path(url, "hruch.txt"), stringsAsFactors = T)
geraet = read.table(file.path(url, "ger.df.txt"), stringsAsFactors = T)
Q1: Zeigen Sie durch einen Barplot im Data
Frame asp
, inwiefern der Konsonantentyp (C
)
von der Betonung (Stress
) beeinflusst wird. Auf der x-Achse
soll die Betonung angezeigt werden, die Füllfarbe der Balken soll sich
nach dem Konsonantentyp richten. Die Balken sollen Proportionen
anzeigen. Die Beschriftung der y-Achse soll “Proportion”
sein.
Q2: Zeigen Sie mit einer Abbildung inwiefern
F2 von der Versuchsperson (Subj
) im Data Frame
vdata
beeinflusst wird. Fügen Sie Ihrem Plot außerdem noch
eine horizontale Linie bei F2 = 1500 Hz hinzu.
Q3: Für den Data Frame preasp
prüfen Sie mit einer Abbildung, wie häufig pro Region
(region
) die verschiedenen Vokaltypen (vtype
)
vorkommen. Es sollen nur Beobachtungen verwendet werden, für die die
Vokaldauer vdur
zwischen 0.09 und 0.18 liegt.
Q4: Für die Daten im Data Frame
franken
prüfen Sie anhand einer Abbildung und getrennt für
die /t, d/ phonologischen Kategorien (in Phon
), inwiefern
das Urteil (Response
: zwei Stufen lenis
,
fortis
) durch das Alter (Alter
) beeinflusst
wird.
Q5: Prüfen Sie anhand einer Abbildung mit
dem Data Frame clara
, inwiefern eine Verbindung zwischen
der Prä-Aspirationsdauer (prdur
) und Wortdauer
(ddur
) vorliegt. Beschriften Sie die Achsen mit “Wortdauer”
und “Prä-Aspirationsdauer”. Erstellen Sie hierbei getrennte Panels für
prä-aspirierte Plosive in initialer und finaler Position
(pos
).
Q6: Im Data Frame glottal
wurde
transkribiert, ob ein [t] oder Glottalverschluss [tQ] produziert wurde
(verschluss
), und ob diese Verschlüsse von einem System für
die automatische Spracherkennung richtig erkannt wurden oder nicht
(erkannt
). Prüfen Sie anhand einer Abbildung, ob die
Erkennung vom Verschluss beeinflusst wurde.
Q7: Für den Data Frame dg
erstellen Sie eine Abbildung, um zu prüfen, inwiefern der zweite Formant
(F2
) mit der Region (Region
) variiert,
getrennt für Männer und Frauen (Gen
). Beschriften Sie die
y-Achse als “F2 (Hz)”.
Q8: Im Data Frame h.df
wurde
voice-onset-time (VOT
) für mehrere Versuchspersonen in der
andalusischen Varietät des Spanischen gemessen. Prüfen Sie anhand von
zwei verschiedenen Abbildungen, ob (a) VOT vom Alter des Sprechers
(Alter
) beeinflusst wurde und (b) ob eine Beziehung
zwischen VOT und der Verschlussdauer (Verschluss
) vorliegt.
Für die (b) Abbildung kodieren Sie die Altersgruppen in
unterschiedlichen Farben. Lassen Sie sich die beiden Abbildungen dann
nebeneinander anzeigen.
Q9: Zeigen Sie anhand des Data Frames
preasp
, ob die Artikulationsstelle cplace
und
die Region (region
) die Verschlussdauer clodur
beeinflussen. Farbkodieren Sie die Abbildung nach
Artikulationsstelle.
Q10: Die Kieferhöhe (kiefer
)
wurde von 10 Versuchspersonen (Vpn
) durch zwei verschiedene
Geräte (geraet
) erhoben. Berechnen Sie für jede
Versuchsperson die Differenz in der Kieferhöhe zwischen diesen beiden
Geräten (Sie benötigen u.a. dazu die Funktion diff()
innerhalb von summarise()
). Erstellen Sie einen Boxplot
dieser Differenzwerte. Überlagern Sie auf Ihre Abbildung einen
horizontale Linie in einer Farbe Ihrer Wahl zum Wert 0 (Null).
Beschriften Sie die y-Achse “Differenz (mm)”, und entfernen Sie die
Beschriftung auf der x-Achse mit
+ theme(axis.text.x = element_blank())
.