Daten & Packages laden

Laden Sie die folgenden Packages und Data Frames:

library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.5     ✓ purrr   0.3.4
## ✓ tibble  3.1.4     ✓ dplyr   1.0.7
## ✓ tidyr   1.1.3     ✓ stringr 1.4.0
## ✓ readr   2.0.1     ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(magrittr)
## 
## Attaching package: 'magrittr'
## The following object is masked from 'package:purrr':
## 
##     set_names
## The following object is masked from 'package:tidyr':
## 
##     extract
url <- "http://www.phonetik.uni-muenchen.de/~jmh/lehre/Rdf"
dip <- read.table(file.path(url, "dip.txt"), stringsAsFactors = T)
preasp <- read.table(file.path(url, "preasp.txt"), stringsAsFactors = T)

Q & A’s

1. Basics

  • Q1.1: Bestätigen Sie, dass die Variable V im Data Frame dip ein Faktor ist.

  • Q1.2: Was sind die Stufen von diesem Faktor?

  • Q1.3: Wieviele einzigartige Elemente gibt es in der Variable Vpn im Data Frame dip?

  • Q1.4: Lassen Sie sich mittels einer Funktion die Vorkommenshäufigkeit der verschiedenen Vokale V im Data Frame dip anzeigen.

  • Q1.5: Finden Sie mittels table() heraus, wie viele Tokens pro Vokalkategorie V pro Versuchsperson Vpn es im Data Frame dip gibt.

2. Filtering & Selecting

  • Q2.1: Lassen Sie sich vom Data Frame dip die Beobachtungen 1-10 ausgeben.

  • Q2.2: Lassen Sie sich vom Data Frame dip die Beobachtungen 15, 18, 20 der Variable V ausgeben.

  • Q2.3: Lassen Sie sich vom Data Frame dip die Variablen d und V für die zehn Beobachtungen mit den höchsten d-Werten ausgeben.

  • Q2.4: Lassen Sie sich vom Data Frame dip die letzten vier Beobachtungen ausgeben.

  • Q2.5: Lassen Sie sich vom Data Frame dip alle ungeraden Zeilen ausgeben. Tipp: Mit der Funktion seq() können Sie einen Vektor von ungeraden Ganzzahlen erzeugen.

  • Q2.6: Lassen Sie sich alle Beobachtungen aus dip ausgeben, wo die Versuchsperson Vpn 67 ist und d höher als 190. (Ergebnis hat 5 Zeilen und 3 Spalten)

  • Q2.7: Lassen Sie sich die fünf Beobachtungen mit den niedrigsten d-Werten aus dip ausgeben, wo der Vokal V nicht “aU” und nicht “OY” ist.

  • Q2.8: Lassen Sie sich die Variable d aus dem Data Frame dip als Vektor ausgeben.

  • Q2.9: Lassen Sie sich aus dem Data Frame preasp die ersten drei Beobachtungen für alle Variablen ausgeben, deren Spaltennamen auf “dur” endet.

  • Q2.10: Lassen Sie sich aus dem Data Frame preasp die erste Beobachtung der Variablen spk bis vc ausgeben.

3. Mutating & Renaming

  • Q3.1: Benennen Sie die Variablen im Data Frame dip dauerhaft um in Dauer, Vokal, Versuchsperson.

  • Q3.2: Hängen Sie an den Data Frame dip temporär eine Spalte namens Index an, die die Zahlen von 1 bis 186 enthält.

  • Q3.3: Hängen Sie an den Data Frame dip dauerhaft eine Spalte namens Länge an, die den Wert “lang” enthält, wenn die Dauer höher ist als 200, “kurz” für Dauerwerte unter 100, und “mittel” für alle anderen Dauerwerte.

  • Q3.4: Hängen Sie an den Data Frame dip dauerhaft eine Spalte namens Region an, die den Wert “Bayern” enthält für die Versuchsperson 67 und “Berlin” für die Versuchsperson 68.