Laden Sie die folgenden Packages und Data Frames:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"),
stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"),
stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"),
stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"),
stringsAsFactors = T)
Q1: Berechnen Sie den Medianwert von
Rating
im Data-Frame rating
getrennt pro
Versuchsperson und pro Sprache.
Q2: Legen Sie eine neue Spalte im Data-Frame
rating
an, genannt Lrating
, die die
logarithmischen Werte von Rating
enthält. Speichern Sie das
Ergebnis als neues Objekt r2
.
Q3: Im Data-Frame Rating
tabellieren Sie die Häufigkeit der Stufen-Kombinationen der Faktoren
Gram
, Type
, Fam
.
Q4: Im Data-Frame Rating
berechnen Sie den Mittelwert von Rating
für die beiden
Stufen des Faktors Fam
und getrennt für die
Versuchspersonen S1
und S10
.
Q5: Im Data-Frame vdata
berechnen Sie log(F2/F1)
getrennt für alle Sprecher und für
die Vokale (Faktor V
) Y
und
U
.
Q6: Im Date-Frame vdata
berechnen Sie den F1-Mittelwert für den Vokal A
getrennt
für alle drei Artikulationsstellen von Cons
.
Q7: Im Data-Frame vdata
berechnen Sie den F1- und F2-Mittelwert getrennt für alle Vokale und in
ungespannten (Faktor: Tense, -
) und gespannten (Faktor:
Tense, +
) Vokalen.
Q8: Im Data-Frame vdata
legen
Sie eine neue Spalte an, D
, die drei Stufen enthält:
low
wenn die Dauer (dur
) kleiner als 75 ms
ist, high
wenn die Dauer größer als 200 ms ist, sonst
mid
. Speichern Sie das Ergebnis als Data-Frame
v2
.
Q9: Für den neu angelegten Data-Frame
v2
, stellen Sie fest, wie oft ungespannte Vokale (Faktor
Tense
, -
) in den Stufen low
,
mid
oder high
vorkommen (Faktor
D
).
Q10: Für den Data-Frame preasp
stellen Sie fest, welche Stadt (city
) die höchste
Vokaldauer (vdur
) hat für den Vokal o
(Faktor
vtype
) und für die Artikulationsstelle kk
(Faktor cplace
).
Q11: Für den Data-Frame preasp
erzeugen Sie eine neue Spalte CV
, die die Summen von
clodur
und vdur
enthält. Speichern Sie diesen
Data-Frame als p2
. Berechnen Sie den Mittelwert von
CV
getrennt für die verschiedenen Wörter
(word
) aber nur in der nördlichen Region
(region: N
).