Laden Sie die folgenden Packages und Data Frames:
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.3 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.3 ✔ tibble 3.2.1
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.0
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
Q1.1: Bestätigen Sie, dass die Variable
V im Data Frame dip ein Faktor
ist.
Q1.2: Was sind die Stufen von diesem Faktor?
Q1.3: Wieviele einzigartige Elemente gibt es
in der Variable Vpn im Data Frame
dip?
Q1.4: Lassen Sie sich mittels einer Funktion
die Vorkommenshäufigkeit der verschiedenen Vokale V im Data
Frame dip anzeigen.
Q1.5: Finden Sie mittels
table() heraus, wie viele Tokens pro Vokalkategorie
V pro Versuchsperson Vpn es im Data Frame
dip gibt.
Q2.1: Lassen Sie sich vom Data Frame
dip die Beobachtungen 1-10 ausgeben.
Q2.2: Lassen Sie sich vom Data Frame
dip die Beobachtungen 15, 18, 20 der Variable
V ausgeben.
Q2.3: Lassen Sie sich vom Data Frame
dip die Variablen d und V für die
zehn Beobachtungen mit den höchsten d-Werten
ausgeben.
Q2.4: Lassen Sie sich vom Data Frame
dip die letzten vier Beobachtungen ausgeben.
Q2.5: Lassen Sie sich vom Data Frame
dip alle ungeraden Zeilen ausgeben. Tipp: Mit der Funktion
seq() können Sie einen Vektor von ungeraden Ganzzahlen
erzeugen.
Q2.6: Lassen Sie sich alle Beobachtungen aus
dip ausgeben, wo die Versuchsperson Vpn S67
ist und d höher als 190. (Ergebnis hat 5 Zeilen und 3
Spalten)
Q2.7: Lassen Sie sich die fünf Beobachtungen
mit den niedrigsten d-Werten aus dip ausgeben,
wo der Vokal V nicht “aU” und nicht “OY” ist.
Q3.1: Benennen Sie die Variablen im Data
Frame dip um in Dauer, Vokal,
Versuchsperson. Speichern Sie das Ergebnis als
dipneu.
Q3.2: Hängen Sie an den Data Frame
dip eine Spalte namens Index an, die die
Zahlen von 1 bis 186 enthält. Speichern Sie das Ergebnis als
dip2.
Q3.3: Hängen Sie an den Data Frame
dip eine Spalte namens Länge an, die den Wert
“lang” enthält, wenn die Dauer höher ist als 200, “kurz” für Dauerwerte
unter 100, und “mittel” für alle anderen Dauerwerte. Speichern Sie das
Ergebnis als dip3.
Q3.4: Hängen Sie an den Data Frame
dip eine Spalte namens Region an, die den Wert
“Bayern” enthält für die Versuchsperson S67 und “Berlin” für die
Versuchsperson 68. Speichern Sie das Ergebnis als
dip4.
Q3.5: Ordnen Sie die Beobachtungen im Data
Frame preasp nach aufsteigendem vdur und
speichern Sie die Ausgabe in einem neuen Data Frame
p2.df.
Q3.6: Ordnen Sie die Beobachtungen im Data
Frame preasp alphabetisch geordnet nach city
und innerhalb von city nach absteigendem vdur.
Speichern Sie das Ergebnis in einem neuen Data Frame
p3.df.