Laden Sie die folgenden Packages und Data-Frames:
library(tidyverse)
library(gridExtra)
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
preasp = read.table(file.path(url, "preasp.txt"), stringsAsFactors = T)
vdata = read.table(file.path(url, "vdata.txt"), stringsAsFactors = T)
form.df = read.table(file.path(url, "form.df.txt"), stringsAsFactors = T)Q1.1: Fünf achtseitige Würfel (nummeriert
mit 1, 2 …8) wurden mehrmals zusammen geworfen. Bei jedem Wurf wurde der
Mittelwert der fünf Zahlen berechnet. Berechnen Sie den
Populationsmittelwert und -standarderror und speichern Sie sie als
Variablen mu und SE.
Q1.2: Führen Sie Q1.1 durch für 200 Würfe (also um 200 Mittelwerte zu bekommen). Erzeugen Sie ein Histogramm Ihrer Mittelwerte, und überlagern Sie die entsprechende Normalverteilung darauf.
Q1.3: Berechnen Sie die Wahrscheinlichkeit, dass ein Mittelwert aus der Verteilung in Q1.2 (a) unter 2.5 oder (b) zwischen 5 und 7 liegt.
Q1.4: Auf der Basis früherer Studien wurde mu = 100 Hz und SE = 15 Hz für die Grundfrequenz in männlichen Stimmen eingeschätzt. Erstellen Sie (a) ein 95%- und (b) ein 99%-Konfidenzintervall auf dieser Basis für die f0 von Männern.
Q1.5: Was ist die Wahrscheinlichkeit, dass die Grundfrequenz von einem Mann (a) unter 80 Hz oder (b) zwischen 110 Hz und 125 Hz liegt?
Q1.6: In einer Gruppe von 50 Männern: wieviele davon müssten daher eine f0 unter 80 Hz haben?
Beispiel. Für den Data-Frame form.df berechnen Sie pro
Versuchsperson (Subject) den Unterschied zwischen
stressed und unstressed in den
F2-Mittelwerten.
Hier benötigen wir pro Versuchsperson:
stressed undunstressed.Wenn z.B. für irgendeine Versuchsperson 1. = 2300 Hz und 2. = 2200 Hz, dann ist der Unterschied in den F2-Mittelwerten für diese Versuchsperson 2300-2200 = 100 Hz.
Es gibt drei Schritte, umd das Ergebnis zu bekommen.
mean() um den F2-Mittelwert pro Versuchsperson für
stressed und unstressed zu berechnenpivot_wider() um die F2-Mittelwerte als Spalten
nebeneinander zu erzeugenHier sind die drei Schritte.
# 1.
form.df %>%
group_by(Subject, Stress) %>%
summarise(F2 = mean(F2)) %>%
ungroup() %>%
# 2.
pivot_wider(names_from=Stress, values_from=F2) %>%
# 3.
mutate(F2diff = stressed - unstressed)## `summarise()` has regrouped the output.
## ℹ Summaries were computed grouped by Subject and Stress.
## ℹ Output is grouped by Subject.
## ℹ Use `summarise(.groups = "drop_last")` to silence this message.
## ℹ Use `summarise(.by = c(Subject, Stress))` for per-operation grouping
## (`?dplyr::dplyr_by`) instead.
## # A tibble: 12 × 4
## Subject stressed unstressed F2diff
## <fct> <dbl> <dbl> <dbl>
## 1 S1 2577 2082 495
## 2 S10 2225 1728 497
## 3 S11 2325 2357 -32
## 4 S12 2399 2091 308
## 5 S2 2122 2023 99
## 6 S3 2192 2207 -15
## 7 S4 2581 2101 480
## 8 S5 2227 2131 96
## 9 S6 2481 1973 508
## 10 S7 2169 2023 146
## 11 S8 2390 1895 495
## 12 S9 2055 1880 175
2.1: Im Data-Frame preasp
berechnen Sie den Mittelwert der vc Dauer für
+preasp und für -preasp (Spalte
Pre) getrennt pro Stadt (city). Der Data-Frame
sollte 30 Reihen und 3 Spalten haben: dessen Spaltennamen sind
city, Pre, und z.B. m (für
Mittelwert).
Q2.2: Subtrahieren Sie die beiden
Mittelwerte pro Stadt voneinander. Der Data-Frame soll dann 15 Reihen
(einen Differenzwert pro Stadt) und zwei Spalten mit Namen
city und z.B. d (für den Unterschied zwischen
den Mittelwerten) beeinhalten.
Q2.3: Erstellen Sie einen einzigen Boxplot dieser 15 Differenzwerte. Überlagern Sie eine horizontale Linie mit Wert von 0 (Null) auf dem Boxplot.
Q2.4: Es geht darum zu berechnen, ob die
Dauer (dur) von A größer ist als die Dauer von
I im Dataframe vdata. Berechnen Sie die
durchschnittliche Dauer von gespanntem A (+ in
der Variable Tense) und von gespanntem I
gemittelt über Artikulationsstelle (Cons),
Sprechgeschwindigkeit (Rate) und Versuchsperson
(Subj). (Eine Reihe im Ergebnis besteht z.B. aus dem
Dauermittelwert von A produziert von bk zu
einer langsamen Sprechgeschwindigkeit, und im Kontext der
Artikulationsstelle K). Ihr Dataframe sollte 5 Spalten
beeinhalten (V, Cons, Rate,
Subj und z.B. m für Mittelwert) und 84
Reihen.
Q2.5: Erstellen Sie daraus einen Data-Frame
der Dauermittelwertunterschiede zwischen A und
I für dieselben Kontexte (Cons,
Rate, Subj). (Ihr Dataframe besteht somit aus
4 Spalten mit Namen Cons, Rate,
Subj und z.B. d der
Dauermittelwerteunterschiede sowie 42 Reihen).
Q2.6: Erzeugen Sie Boxplots der
Dauermittelwertunterschiede zwischen A und I
getrennt für die Artikulationsstellen (Cons) und
Sprechgeschwindigkeiten (Rate). Überlagern Sie eine
horizontale Line zu dem Wert von 0 (Null) auf die Boxplots. Ihre
Abbildung enthält somit 6 verschiedene Boxplots, einen pro
Sprechgeschwindkeit und pro Artikulationsstelle, und jeder Box enthält
einen Wert pro Sprecher. Bestätigt die Abbildung eine höhere Dauer für
A im Vgl. zu I?