epg = read.table(file.path(pfad, "epg.txt")) y = with(epg, F1) x = with(epg, SUM1278) # Mittelwert von y, Mittelwert von x; Anzahl der Werte in x (oder y) my = mx = n = covxy = cov(y,x) # Korrelation gleicht die Kovarianz # dividiert durch (sd von y Mal sd von x) r = # Regressionsneigung: r mal sd von y dividiert durch die sd von x b = # Intercept: Mittelwert von y - (b mal Mittelwert von x) k = # Eingeschaetze Werte: yhut = # Error: Der Unterschied zwischen den tatsaechlichen und eingeschaetzen # Werte error = # SSE: sum-of-squares (Error) SSE = # SSR: sum-of-squares (Regression) SSR = # SSY: sum-of-squares (Total) SSY = ### Bestaetigung: SSY = SSR + SSE (ja/nein?) ## Zwei Methoden r-squared zu berechnen ## 1 rsquared = ## 2 rsquared = ## Pruefen ob es eine eine signifikante lineare Beziehung ## zwischen x und y gibt (ob rsquared signifikant von 0 abweicht). ## critical ratio (tstat): r dividiert durch die Standardabweichung von r ## die Standardabweichung von r ist rsb = sqrt( (1 - r^2)/(n-2)) tstat = # Die F-statistik ist tstat hoch 2 fstat = # Pruefen - selbe Wahrscheinlichkeit? 1 - pf(fstat, 1, n-2) # Noch eine Weise die F-Statstik zu berechnen: MSE = MSR = fstat = # Ergebnis Es gibt einen signifikanten/nicht-signifikanten Unterschied zwischen x un y r-squared = xxx, F= ..., df= ...,... p .... # Die Regressionlinie berechnen mit lm() reg = # x, y Werte abbilden plot(x,y) # Regressionslinie ueberlagern # Die Quantitaeten tstat, fstat, SSR/SSY, die Wurzel von MSE # hier idenfizieren summary(reg) # Die Quantitiaeten SSR, SSE, MSR, MSE,fstat hier identifizieren anova(reg)