Daten & Packages laden

Laden Sie die folgenden Packages und Data Frames:

library(tidyverse)

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.2.1     ✔ readr     2.2.0
## ✔ forcats   1.0.1     ✔ stringr   1.6.0
## ✔ ggplot2   4.0.3     ✔ tibble    3.3.1
## ✔ lubridate 1.9.5     ✔ tidyr     1.3.2
## ✔ purrr     1.2.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

urla = "https://www.phonetik.uni-muenchen.de/studium_lehre/"
urlb = "lehrmaterialien/R_speech_processing/Rdf"
url = paste0(urla, urlb)
rating <- read.table(file.path(url, "rating.txt"), 
                     stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"), 
                     stringsAsFactors = T)
asp <- read.table(file.path(url, "asp.txt"), 
                     stringsAsFactors = T)
vdata <- read.table(file.path(url, "vdata.txt"), 
                     stringsAsFactors = T)

Q & A’s

Q1: Für den Data Frame vdata zählen Sie, wie oft die Kombinationen der Vokal- (V) und Konsonantstufen (Cons) vorkommen (d.h. wieviele Beobachtungen, die sowohl einen A als auch einen P haben, wieviele Beobachtungen die sowohl einen A und einen T haben, wieviele Beobachtungen die sowohl einen Y und einen K usw. für alle möglichen Kombinationen von Vokalen und Konsonanten). (Ergebnis hat 21 Reihen und 3 Spalten).
Q2: Für den Data Frame asp berechnen Sie getrennt für die Versuchspersonen dlm und hpt den Dauermittelwert (d) aller unbetonten (un, Faktor Bet) und betonten (be, Faktor Bet) /t/-Konsonanten (t, Faktor Kons) (Ergebnis hat 4 Reihen und 3 Spalten).
Q3: Berechnen Sie für die drei verschiedenen Konsonanten (cplace) im Data Frame preasp die maximale, minimale und durchschnittliche Verschlussdauer (clodur), und sortieren Sie den erzeugten Data Frame nach absteigender durchschnittlicher Verschlussdauer. (Ergebnis hat 3 Reihen und 4 Spalten)
Q4: Berechnen Sie für alle Beobachtungen im Data Frame preasp, wo der Vokal (vtype) “a” und die Region (region) ungleich “C” ist, die Standardabweichung der Vokaldauer (vdur) pro Region und Stadt (city). (Ergebnis hat 12 Zeilen und 3 Spalten)
Q5: Berechnen Sie pro Versuchsperson (Vpn) das erste und dritte Quartil des Ratings (Rating) im Data Frame rating. (Ergebnis hat 26 Zeilen und 3 Spalten)
Q6: Berechnen Sie für die ersten 100 Beobachtungen im Data Frame rating den Median und den Mittelwert der Ratings (Rating) pro Sprache (Lang). (Ergebnis hat 2 Zeilen und 3 Spalten)
Q7: Finden Sie heraus, wie viele Beobachtungen es pro Versuchsperson (Vpn) im Data Frame rating gibt und bestätigen Sie, dass das Ergebnis davon hat 26 Zeilen und 2 Spalten hat.
Q8: Finden Sie heraus, wie viele einzigartige Sprecher spk es pro Stadt (city), Region (region), und Konsonant (cplace) im Data Frame preasp gibt (Ergebnis hat 45 Zeilen und 4 Spalten). Lassen Sie sich anschließend ausgeben, für welche Kombination(en) aus Stadt, Region und Konsonant es die wenigsten einzigartigen Sprecher gibt. Tipp: Hierfür müssen Sie sicherstellen, dass das Ergebnis des ersten Teils ein ungruppierter Data Frame ist.

Übung 3

Jonathan Harrington / Johanna Cronenberg

Daten & Packages laden

Q & A’s