epg = read.table(file.path(pfad, "epg.txt"))
y = with(epg, F1)
x = with(epg, SUM1278)

# Mittelwert von y, Mittelwert von x; Anzahl der Werte in x (oder y)
my =
mx = 
n = 
covxy = cov(y,x)
# Korrelation gleicht die  Kovarianz 
# dividiert durch  (sd von y Mal sd von x)
r =
# Regressionsneigung: r mal sd von y dividiert durch die sd von x
b =
# Intercept: Mittelwert von y - (b mal Mittelwert von x)
k =
# Eingeschaetze Werte:
yhut =

# Error: Der Unterschied zwischen den tatsaechlichen und eingeschaetzen
# Werte
error = 

# SSE: sum-of-squares (Error)
SSE = 

# SSR: sum-of-squares (Regression)
SSR =

# SSY: sum-of-squares (Total)
SSY =

### Bestaetigung: SSY = SSR + SSE  (ja/nein?)

## Zwei Methoden r-squared zu berechnen
## 1
rsquared =

## 2
rsquared =

## Pruefen ob es eine eine signifikante lineare Beziehung
## zwischen x und y gibt (ob rsquared signifikant von 0 abweicht).
## critical ratio (tstat): r dividiert durch die Standardabweichung von r
## die Standardabweichung von r ist 
rsb = sqrt( (1 - r^2)/(n-2))
tstat = 


# Die F-statistik ist tstat hoch 2
fstat = 

# Pruefen - selbe Wahrscheinlichkeit?
1 - pf(fstat, 1, n-2)

# Noch eine Weise die F-Statstik zu berechnen:
MSE =
MSR =
fstat =

# Ergebnis
Es gibt einen signifikanten/nicht-signifikanten
Unterschied zwischen x un y
r-squared = xxx, F= ..., df= ...,... p ....

# Die Regressionlinie berechnen mit lm()
reg =

# x, y Werte abbilden
plot(x,y)
# Regressionslinie ueberlagern


# Die  Quantitaeten tstat, fstat, SSR/SSY, die Wurzel von MSE
# hier idenfizieren
summary(reg)

# Die Quantitiaeten SSR, SSE, MSR, MSE,fstat hier identifizieren
anova(reg)