mein Problem ist nicht, dass das Bestimmtheitsmaß R^2 immer positiv
ist.
Nach meinen Beobachtungen hat die Microsoft Excel Analyse-Funktion
REGRESSION den Fehler, dass sie aus einer negativen Korrelation eine
positive macht.
Herzliche Grüße
Fritz
falls Du den ausgewiesenen "multiplen Korrelationskoeffizienten" meinst,
der bedeutet was anderes als die Korrelation der Eingangsdaten.
Und zwar wird dabei das _Ergebnis_ der Regressionsformel angewandt auf
die Eingangsvariablen berechnet und mit dem Y-Vektor korreliert.
Das Ergebnis ist immer >= 0. Anschaulich gesprochen wird bei der
einfachen Regression das Negative durch die negative Steigung der
Regressionsgeraden aufgehoben.
Dieser multiple Korrelationskoeffizient macht aber vor allem Sinn, wenn
man mehr als eine X-Variable hat, daher auch die Bezeichnung.
Bei der einfachen Regression wird er zu einem Trivialfall und sagt halt
nicht mehr aus, als der Absolutwert der einfachen Korrelation der
Eingangsvariablen, da ja die lineare Transformation des X-Vektors durch
die Regressionsgerade diesen Absolutwert nicht beeinflusst.
Beispiel:
X-Werte: 10, 20, 30
Y-Werte: 25, 20, 18
Korrelation X mit Y: -0.970725343394151
Regression-Steigung: -0.35
Regression-Konstante: 28
Regressionsformel: Y-Dach = -0.35 * X + 28
Y-Dach-Werte: 24.5, 21, 17.5
multipler Korrelationskoeffizient =
Korrelation Y mit Y-Dach: 0,970725343394151
MfG
Franz-Josef
Danke Franz-Josef,
habe von dir etwas gelernt.
Noch eine Frage: Korr(X,Y) = - Korr(Y,YDach)
Das müsste doch allgemein zu zeigen sein.
Herzliche Grüße
Fritz
allgemein gilt in dem Fall der einfachen Regression:
Korr(X,Y) = sign(Beta) * Korr(Y,YDach)
(wobei Beta die Steigung der Regressionsgeraden sei und sign(x) die
Vorzeichenfunktion)
Inhaltlich: Die Korrelation der Eingabewerte ist genau dann negativ,
wenn die Steigung der Regressiongeraden negativ ist.
Falls also die Korrelation -und damit die Steigung- positiv sind, gilt:
Korr(X,Y) = Korr(Y,YDach),
falls die Korrelation (und damit die Steigung) negativ sind:
Korr(X,Y) = -Korr(Y,YDach).
MfG
Franz-Josef
Wenn ich jetzt noch deinen Satz "da ja die lineare Transformation des
X-Vektors durch die Regressionsgerade diesen Absolutwert nicht
beeinflusst." verstehe, habe ich alles verstanden.
Herzliche Grüße aus Wien
Fritz
Wenn man alle X-Werte mit einer positiven Konstanten multipliziert,
ändert sich an der Korrelation zu Y nichts. Die Korrelation ist (anders
als die Kovarianz) absichtlich so definiert. Als Beispiel soll ja die
Korrelation Körpergröße mit Gewicht immer den gleichen Wert haben, egal
ob die Größe in cm, m oder Zoll und das Gewicht in g, kg, oder Pfund
gemessen wird.
Wie das technisch gemacht wird, kannst Du dir in der EXCEL-Online-Hilfe
zu "KORREL" ansehen. Die Formel für die Streuungen im Nenner steht unter
"STABWN". Mit ein wenig Algebra sieht man:
Eine positive Konstante -auf alle X-Werte multipliziert- lässt sich
wegkürzen. Eine negative Konstante jedoch liefert in der Streuung im
Nenner nur den Absolutwert, da die Streuung wegen der Wurzel immer
positiv ist. Dadurch bleibt nach dem Kürzen noch eine -1 im Zähler übrig.
MfG
Franz-Josef