Laden Sie die folgenden Packages und Data Frames:
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ ggplot2 3.3.5 ✓ purrr 0.3.4
## ✓ tibble 3.1.4 ✓ dplyr 1.0.7
## ✓ tidyr 1.1.3 ✓ stringr 1.4.0
## ✓ readr 2.0.1 ✓ forcats 0.5.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(magrittr)
##
## Attaching package: 'magrittr'
## The following object is masked from 'package:purrr':
##
## set_names
## The following object is masked from 'package:tidyr':
##
## extract
<- "http://www.phonetik.uni-muenchen.de/~jmh/lehre/Rdf"
url <- read.table(file.path(url, "dip.txt"), stringsAsFactors = T)
dip <- read.table(file.path(url, "preasp.txt"), stringsAsFactors = T) preasp
Q1.1: Bestätigen Sie, dass die Variable V
im Data Frame dip
ein Faktor ist.
Q1.2: Was sind die Stufen von diesem Faktor?
Q1.3: Wieviele einzigartige Elemente gibt es in der Variable Vpn
im Data Frame dip
?
Q1.4: Lassen Sie sich mittels einer Funktion die Vorkommenshäufigkeit der verschiedenen Vokale V
im Data Frame dip
anzeigen.
Q1.5: Finden Sie mittels table()
heraus, wie viele Tokens pro Vokalkategorie V
pro Versuchsperson Vpn
es im Data Frame dip
gibt.
Q2.1: Lassen Sie sich vom Data Frame dip
die Beobachtungen 1-10 ausgeben.
Q2.2: Lassen Sie sich vom Data Frame dip
die Beobachtungen 15, 18, 20 der Variable V
ausgeben.
Q2.3: Lassen Sie sich vom Data Frame dip
die Variablen d
und V
für die zehn Beobachtungen mit den höchsten d
-Werten ausgeben.
Q2.4: Lassen Sie sich vom Data Frame dip
die letzten vier Beobachtungen ausgeben.
Q2.5: Lassen Sie sich vom Data Frame dip
alle ungeraden Zeilen ausgeben. Tipp: Mit der Funktion seq()
können Sie einen Vektor von ungeraden Ganzzahlen erzeugen.
Q2.6: Lassen Sie sich alle Beobachtungen aus dip
ausgeben, wo die Versuchsperson Vpn
67 ist und d
höher als 190. (Ergebnis hat 5 Zeilen und 3 Spalten)
Q2.7: Lassen Sie sich die fünf Beobachtungen mit den niedrigsten d
-Werten aus dip
ausgeben, wo der Vokal V
nicht “aU” und nicht “OY” ist.
Q2.8: Lassen Sie sich die Variable d
aus dem Data Frame dip
als Vektor ausgeben.
Q2.9: Lassen Sie sich aus dem Data Frame preasp
die ersten drei Beobachtungen für alle Variablen ausgeben, deren Spaltennamen auf “dur” endet.
Q2.10: Lassen Sie sich aus dem Data Frame preasp
die erste Beobachtung der Variablen spk
bis vc
ausgeben.
Q3.1: Benennen Sie die Variablen im Data Frame dip
dauerhaft um in Dauer
, Vokal
, Versuchsperson
.
Q3.2: Hängen Sie an den Data Frame dip
temporär eine Spalte namens Index
an, die die Zahlen von 1 bis 186 enthält.
Q3.3: Hängen Sie an den Data Frame dip
dauerhaft eine Spalte namens Länge
an, die den Wert “lang” enthält, wenn die Dauer höher ist als 200, “kurz” für Dauerwerte unter 100, und “mittel” für alle anderen Dauerwerte.
Q3.4: Hängen Sie an den Data Frame dip
dauerhaft eine Spalte namens Region
an, die den Wert “Bayern” enthält für die Versuchsperson 67 und “Berlin” für die Versuchsperson 68.