Daten & Packages laden

Laden Sie die folgenden Packages und Data Frames:

library(tidyverse)

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.2.1     ✔ readr     2.2.0
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ ggplot2   4.0.3     ✔ tibble    3.3.1
## ✔ lubridate 1.9.5     ✔ tidyr     1.3.2
## ✔ purrr     1.2.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"), 
                     stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"), 
                     stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"), 
                  stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"), 
                    stringsAsFactors = T)

Q & A’s

Q1: Berechnen Sie den Medianwert von Rating im Data-Frame rating getrennt pro Versuchsperson und pro Sprache.
Q2: Legen Sie eine neue Spalte im Data-Frame rating an, genannt Lrating, die die logarithmischen Werte von Rating enthält. Speichern Sie das Ergebnis als neues Objekt r2.
Q3: Im Data-Frame rating tabellieren Sie die Häufigkeit der Stufen-Kombinationen der Faktoren Gram, Type, Fam.
Q4: Im Data-Frame rating berechnen Sie den Mittelwert von Rating für die beiden Stufen des Faktors Fam und getrennt für die Versuchspersonen S1 und S10.
Q5: Im Data-Frame vdata berechnen Sie den Mittelwert von log(F2/F1) getrennt für alle Sprecher und für die Vokale (Faktor V) Y und U.
Q6: Im Date-Frame vdata berechnen Sie den F1-Mittelwert für den Vokal A getrennt für alle drei Artikulationsstellen von Cons.
Q7: Im Data-Frame vdata berechnen Sie den F1- und F2-Mittelwert getrennt für alle Vokale und in ungespannten (Faktor: Tense, -) und gespannten (Faktor: Tense, +) Vokalen.
Q8: Im Data-Frame vdata legen Sie eine neue Spalte an, D, die drei Stufen enthält: low wenn die Dauer (dur) kleiner als 75 ms ist, high wenn die Dauer größer als 200 ms ist, sonst mid. Speichern Sie das Ergebnis als Data-Frame v2.
Q9: Für den neu angelegten Data-Frame v2, stellen Sie fest, wie oft ungespannte Vokale (Faktor Tense, -) in den Stufen low, mid oder high vorkommen (Faktor D).
Q10: Für den Data-Frame preasp stellen Sie fest, welche Stadt (city) die höchste Vokaldauer (vdur) hat für den Vokal o (Faktor vtype) und für die Artikulationsstelle kk (Faktor cplace).
Q11: Für den Data-Frame preasp erzeugen Sie eine neue Spalte CV, die die Summen von clodur und vdur enthält. Speichern Sie diesen Data-Frame als p2. Berechnen Sie den Mittelwert von CV getrennt für die verschiedenen Wörter (word) aber nur in der nördlichen Region (region: N).

Übung 3b

Jonathan Harrington / Johanna Cronenberg

Daten & Packages laden

Q & A’s