Laden Sie die folgenden Packages und Data Frames:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"),
stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"),
stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"),
stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"),
stringsAsFactors = T)Q1: Für den Data Frame vdata
zählen Sie, wie oft die Kombinationen der Vokal- (V) und
Konsonantstufen (Cons) vorkommen (d.h. wieviele
Beobachtungen, die sowohl einen A als auch einen
P haben, wieviele Beobachtungen die sowohl einen
A und einen T haben, wieviele Beobachtungen
die sowohl einen Y und einen K usw. für alle
möglichen Kombinationen von Vokalen und Konsonanten). (Ergebnis hat 21
Reihen und 3 Spalten).
Q2: Für den Data Frame asp
berechnen Sie getrennt für die Versuchspersonen dlm und
hpt den Dauermittelwert aller unbetonten (un,
Faktor Bet) und betonten (be, Faktor
Bet) /t/-Konsonanten (Ergebnis hat 4 Reihen und 3
Spalten).
Q3: Berechnen Sie für die drei verschiedenen
Konsonanten (cplace) im Data Frame preasp die
maximale, minimale und durchschnittliche Verschlussdauer
(clodur), und sortieren Sie den erzeugten Data Frame nach
absteigender durchschnittlicher Verschlussdauer. (Ergebnis hat 3 Reihen
und 4 Spalten)
Q4: Berechnen Sie für alle Beobachtungen im
Data Frame preasp, wo der Vokal (vtype) “a”
und die Region (region) ungleich “C” ist, die
Standardabweichung der Vokaldauer (vdur) pro Region und
Stadt (city). (Ergebnis hat 12 Zeilen und 3
Spalten)
Q5: Berechnen Sie pro Versuchsperson
(Vpn) das erste und dritte Quartil des Ratings
(Rating) im Data Frame rating. (Ergebnis hat
26 Zeilen und 3 Spalten)
Q6: Berechnen Sie für die ersten 100
Beobachtungen im Data Frame rating den Median und den
Mittelwert der Ratings (Rating) pro Sprache
(Lang). (Ergebnis hat 2 Zeilen und 3 Spalten)
Q7: Finden Sie heraus, wie viele
Beobachtungen es pro Versuchsperson (Vpn) im Data Frame
rating gibt und bestätigen Sie, dass das Ergebnis davon hat
26 Zeilen und 2 Spalten hat.
Q8: Finden Sie heraus, wie viele
einzigartige Sprecher spk es pro Stadt (city),
Region (region), und Konsonant (cplace) im
Data Frame preasp gibt (Ergebnis hat 45 Zeilen und 4
Spalten). Lassen Sie sich anschließend ausgeben, für welche
Kombination(en) aus Stadt, Region und Konsonant es die wenigsten
einzigartigen Sprecher gibt. Tipp: Hierfür müssen Sie sicherstellen,
dass das Ergebnis des ersten Teils ein ungruppierter Data Frame
ist.