Laden Sie die folgenden Packages und Data Frames:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"),
stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"),
stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"),
stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"),
stringsAsFactors = T)
Q1: Für den Data Frame vdata
zählen Sie, wie oft die Kombinationen der Vokal- (V
) und
Konsonantstufen (Cons
) vorkommen (d.h. wieviele
Beobachtungen, die sowohl einen A
als auch einen
P
haben, wieviele Beobachtungen die sowohl einen
A
und einen T
haben, wieviele Beobachtungen
die sowohl einen Y
und einen K
usw. für alle
möglichen Kombinationen von Vokalen und Konsonanten). (Ergebnis hat 21
Reihen und 3 Spalten).
Q2: Für den Data Frame asp
berechnen Sie getrennt für die Versuchspersonen dlm
und
hpt
den Dauermittelwert aller unbetonten (un
,
Faktor Bet
) und betonten (be
, Faktor
Bet
) /t/-Konsonanten (Ergebnis hat 4 Reihen und 3
Spalten).
Q3: Berechnen Sie für die drei verschiedenen
Konsonanten (cplace
) im Data Frame preasp
die
maximale, minimale und durchschnittliche Verschlussdauer
(clodur
), und sortieren Sie den erzeugten Data Frame nach
absteigender durchschnittlicher Verschlussdauer. (Ergebnis hat 3 Reihen
und 4 Spalten)
Q4: Berechnen Sie für alle Beobachtungen im
Data Frame preasp
, wo der Vokal (vtype
) “a”
und die Region (region
) ungleich “C” ist, die
Standardabweichung der Vokaldauer (vdur
) pro Region und
Stadt (city
). (Ergebnis hat 12 Zeilen und 3
Spalten)
Q5: Berechnen Sie pro Versuchsperson
(Vpn
) das erste und dritte Quartil des Ratings
(Rating
) im Data Frame rating
. (Ergebnis hat
26 Zeilen und 3 Spalten)
Q6: Berechnen Sie für die ersten 100
Beobachtungen im Data Frame rating
den Median und den
Mittelwert der Ratings (Rating
) pro Sprache
(Lang
). (Ergebnis hat 2 Zeilen und 3 Spalten)
Q7: Finden Sie heraus, wie viele
Beobachtungen es pro Versuchsperson (Vpn
) im Data Frame
rating
gibt und bestätigen Sie, dass das Ergebnis davon hat
26 Zeilen und 2 Spalten hat.
Q8: Finden Sie heraus, wie viele
einzigartige Sprecher spk
es pro Stadt (city
),
Region (region
), und Konsonant (cplace
) im
Data Frame preasp
gibt (Ergebnis hat 45 Zeilen und 4
Spalten). Lassen Sie sich anschließend ausgeben, für welche
Kombination(en) aus Stadt, Region und Konsonant es die wenigsten
einzigartigen Sprecher gibt. Tipp: Hierfür müssen Sie sicherstellen,
dass das Ergebnis des ersten Teils ein ungruppierter Data Frame
ist.