ich habe eine kurze Fragen zur Defnition des Standardfehlers bei einem
gewichteten Mittelwert, bei der ich gerade nicht weiterkomme.
In meiner Auswertung habe ich eine Patientengruppe und eine
Kontrollgruppe. Um die beiden Gruppen bezüglich einer Eigenschaft zu
vergleichen, habe ich den Mittelwert der Eigenschaft in der
Patientengruppe berechnet und für die Kontrollgruppe ein dazugehörigen
gewichtetes Mittel. Als Gewichte dienen die Alters- und
Geschlechtsverteilung der Patienten. Jetzt brauche ich Standardfehler
für beide Mittelwerte. Bei der Patientengruppe kann ich einen normalen
Standardfehler des Mittelwerts berechnen, aber ich bin mir nicht
sicher, wie ich den Standardfehler für das gewichtete Mittel der
Kontrollen berechne. Irgendwo habe ich mal gelesen, dass man bei
diesem Standardfehler durch die Summe der Gewichte teilt. Das wäre bei
mir dann die Anzahl der Patienten. Aber da ich eigentlich sehr viel
mehr Kontrollen als Patienten habe, sollte der Standardfehler der
Kontrollen doch kleiner sein, oder? Jetzt ist er ungefähr gleich groß,
weil die Varianz in beiden Gruppen ungefähr gleich ist.
Kennt ihr irgendeine "offizielle" Definition für einen Standardfehler
eines gewichteten Mittels? Oder kennt ihr irgendwelche Artikel/Bücher,
in denen ich das nachlesen könnte?
Ich würde mich freuen, wenn mit jemand ein wenig weiterhelfen könnte.
Viele Grüße
Lina
> Hallo,
>
> ich habe eine kurze Fragen zur Defnition des Standardfehlers bei einem
> gewichteten Mittelwert, bei der ich gerade nicht weiterkomme.
>
> In meiner Auswertung habe ich eine Patientengruppe und eine
> Kontrollgruppe. Um die beiden Gruppen bezüglich einer Eigenschaft zu
> vergleichen, habe ich den Mittelwert der Eigenschaft in der
> Patientengruppe berechnet und für die Kontrollgruppe ein dazugehörigen
> gewichtetes Mittel.
>
Du vergleichst also einen Mittelwert einer statistischen Variablen mit
einem gewichteten Mittelwert einer anderen satistischen Variablen.
>
Warum das?
>
Damit setzt du voraus dass die beiden Variablen nicht die gleiche
Verteilung haben.
>
Was willst du eigentlich tun?
>
Ich nehme an du willst aufgrund statistischer Werte die beiden Gruppen
miteinander vergleichen. Dazu reichen die von dir gemachten Berechnungen
nicht aus.
>
> In meiner Auswertung habe ich eine Patientengruppe und eine
> Kontrollgruppe. Um die beiden Gruppen bezüglich einer Eigenschaft zu
> vergleichen, habe ich den Mittelwert der Eigenschaft in der
> Patientengruppe berechnet und für die Kontrollgruppe ein dazugehörigen
> gewichtetes Mittel.
Warum werden die beiden Gruppen auf unterschiedliche Weise ausgewertet?
Das ergibt für mich keinen Sinn. Entweder muss in beiden Gruppen jeweils
der Mittelwert berechnet werden, oder in beiden Gruppen ein gewichteter
Mittelwert. Sonst vergleicht man doch Äpfel mit Bananen.
Gruss
Michael
ich möchte die Patientengruppe mit der Kontrollgruppe bezüglich einer
Eigenschaft vergleichen. Jetzt ist es aber so, dass diese Eigenschaft
stark vom Alter und dem Geschlecht abhängt und diese Verteilungen bei
Patienten und Kontrollen sehr unterschiedlich ist. Mich interessiert,
ob die Patienten im Mittel sich von den Kontrollen unterscheiden, aber
adjustiert fürs Alter und das Geschlecht. Für einen Test würde ich
jetzt eine ANOVA berechnen und für Alter und Geschlecht adjustieren.
Jetzt möchte ich aber für eine Grafik Mittelwert und Standardfehler
darstellen. Für die Patienten so wie sie sind und für die Kontrollen
die Gewichtung nach der Alters-und Geschlechtsverteilung der
Patienten.
Ist jetzt klarer, was ich meine?
Viele Grüße
Lina
> Hallo ihr beiden,
>
> ich möchte die Patientengruppe mit der Kontrollgruppe bezüglich einer
> Eigenschaft vergleichen. Jetzt ist es aber so, dass diese Eigenschaft
> stark vom Alter und dem Geschlecht abhängt und diese Verteilungen bei
> Patienten und Kontrollen sehr unterschiedlich ist. Mich interessiert,
> ob die Patienten im Mittel sich von den Kontrollen unterscheiden, aber
> adjustiert fürs Alter und das Geschlecht. Für einen Test würde ich
> jetzt eine ANOVA berechnen und für Alter und Geschlecht adjustieren.
> Jetzt möchte ich aber für eine Grafik Mittelwert und Standardfehler
> darstellen. Für die Patienten so wie sie sind und für die Kontrollen
> die Gewichtung nach der Alters-und Geschlechtsverteilung der
> Patienten.
>
> Ist jetzt klarer, was ich meine?
Dann kannst du doch eine ANCOVA rechnen. Die berechnet den Effekt des
Treatments, nachdem die Effekte der Faktoren Alter und Geschlecht
herauspartialisiert wurden.
In der englischen Wikipedia (Weighted Mean) steht eine Formel für den
Standardfehler des gewichteten Mittels, die die Standardabweichung der
einzelnen Personen berücksichtigt. Mir ist aber nicht ganz klar, wo du
die her bekommst.
Ich habe jetzt auch eine Dissertation gefunden, die eine Gewichtung
berechnet, aber auf Survivaldaten. Vielleicht könnten ihr mir sagen,
ob das so stimmen kann:
Seien w1-w20 die Gewichte für die einzelnen Gruppen und m1-m20 der
Mittelwert in der entsprechenden Gruppe, dann ist die Varianz des
gewichteten Mittels doch gleich:
Var(w1*m1 + w2*ms + ... + w20*m20)
= w1^2 * Var(m1) + w2^2 * Var(m2) + ... + w20^2 * Var(m20)
= w1^2 * SE(m1)^2 + w2^2 * SE(m2)^2 + ... + w20^2 * SE(m20)^2
mit SE der Standardfehler des Mittelwerts innerhalb der Altergruppe -
und den kann ich auch berechnen.
Und der Standardfehler des gewichteten Mittels müsste doch dann die
Wurzel der oberen Gleichung sein, oder? Stimmt das so weit?
> Im Wikipedia (Weighted Means) steht doch nur die Formel für die
> Weighted Sample Variance, oder habe ich da etwas übersehen?
„For uncorrelated observations with standard deviations σi, the weighted
sample *mean* has standard deviation“
Das ist für mich der Standardfehler.
und weiter unten
> and the variance of the weighted mean is \sigma_{\bar{x}}^2 = \frac{ 1
> }{\sum_{i=1}^n (1/{\sigma_i}^2)}, which reduces to \sigma_{\bar{x}}^2
> = \frac{ {\sigma_0}^2 }{n}, when all \sigma_i = \sigma_0.\,
Und wenn man daraus die Wurzel zieht, hat man die Formel, die ich für den
Standardfehler kenne.
> Die kann ich ja auch ausrechnen, da ich 20 Alters-Geschlechts-Gruppen
> in der Gesamtgruppe habe (die ich gewichtet zusammenführen möchte) und
> innerhalb der Gruppen gibt es ja eine Varianz. Ich nehme somit auch
> das Alter nicht als kontinuerliche sondern als kategorielle Variable
> (das hätte ich vielleicht sagen sollen...).
Na, dann sollte es doch jetzt klar sein.
> ich möchte die Patientengruppe mit der Kontrollgruppe bezüglich einer
> Eigenschaft vergleichen. Jetzt ist es aber so, dass diese Eigenschaft
> stark vom Alter und dem Geschlecht abhängt und diese Verteilungen bei
> Patienten und Kontrollen sehr unterschiedlich ist.
Das ist nicht gut. Die Alters- und Geschlechtsverteilung müsste schon in
beiden Gruppen ähnlich sein, wenn ein belastbares Ergebnis rauskommen
soll. Notfalls müssen die Verteilungen eben gleich gemacht werden, indem
man einige Patienten weglässt.
Wenn sich die Gruppen signifikant in ihrer Zusammensetzung
unterschieden, kann man diese Unterschiede nicht durch mathematische
Methoden wegrechnen.
Gruss
Michael
man kann Unterschiede im Alter und Geschlecht schon durch Adjustierung
und Gewichtung herausrechnen. Sonst könnte man fast nie Vergleiche
zwischen Patienten und Gesunden machen. Die Patienten haben ganz
natürlich ein anderes Profil, denn die Kontrollgruppe hat eine
Verteilung, die repräsentativ für die Allgemeinbevölkerung ist. Man
kann ohne die Gewichtung und ohne die Adjustierung in der Situation
gar nichts sagen, aber nachdem man das durchgeführt hat, ist eine
Aussage möglich. Ich möchte ja im Endeffekt nicht sagen, dass sich
diese festen Gruppen an sich unterscheiden, sondern, dass sich die
Patienten von einer Gruppe, die eine ähnliche bzw. gleiche
Geschlechts- und Altersverteilung hat, unterscheidet. Ich würde nicht
einfach Teile der Gruppe fallen lassen, um Patienten und Kontrollen zu
matchen, da damit die Power mehr Abnehmen würde als mit einer
Adjustierung.
Viele Grüße
Lina