Laden Sie die folgenden Packages und Data Frames:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"),
stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"),
stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"),
stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"),
stringsAsFactors = T)Q1: Berechnen Sie den Medianwert von
Rating im Data-Frame rating getrennt pro
Versuchsperson und pro Sprache.
Q2: Legen Sie eine neue Spalte im Data-Frame
rating an, genannt Lrating, die die
logarithmischen Werte von Rating enthält. Speichern Sie das
Ergebnis als neues Objekt r2.
Q3: Im Data-Frame Rating
tabellieren Sie die Häufigkeit der Stufen-Kombinationen der Faktoren
Gram, Type, Fam.
Q4: Im Data-Frame Rating
berechnen Sie den Mittelwert von Rating für die beiden
Stufen des Faktors Fam und getrennt für die
Versuchspersonen S1 und S10.
Q5: Im Data-Frame vdata
berechnen Sie log(F2/F1) getrennt für alle Sprecher und für
die Vokale (Faktor V) Y und
U.
Q6: Im Date-Frame vdata
berechnen Sie den F1-Mittelwert für den Vokal A getrennt
für alle drei Artikulationsstellen von Cons.
Q7: Im Data-Frame vdata
berechnen Sie den F1- und F2-Mittelwert getrennt für alle Vokale und in
ungespannten (Faktor: Tense, -) und gespannten (Faktor:
Tense, +) Vokalen.
Q8: Im Data-Frame vdata legen
Sie eine neue Spalte an, D, die drei Stufen enthält:
low wenn die Dauer (dur) kleiner als 75 ms
ist, high wenn die Dauer größer als 200 ms ist, sonst
mid. Speichern Sie das Ergebnis als Data-Frame
v2.
Q9: Für den neu angelegten Data-Frame
v2, stellen Sie fest, wie oft ungespannte Vokale (Faktor
Tense, -) in den Stufen low,
mid oder high vorkommen (Faktor
D).
Q10: Für den Data-Frame preasp
stellen Sie fest, welche Stadt (city) die höchste
Vokaldauer (vdur) hat für den Vokal o (Faktor
vtype) und für die Artikulationsstelle kk
(Faktor cplace).
Q11: Für den Data-Frame preasp
erzeugen Sie eine neue Spalte CV, die die Summen von
clodur und vdur enthält. Speichern Sie diesen
Data-Frame als p2. Berechnen Sie den Mittelwert von
CV getrennt für die verschiedenen Wörter
(word) aber nur in der nördlichen Region
(region: N).