Øving 10

coron

unread,

Apr 23, 2012, 5:05:25 AM4/23/12

to ST2304 2012

Hei, jeg lurer på oppgave 4 i problem 1.

4. Compute the chi-square statistic for the goodness-of-fit test of
the model. Can you reject this model based on the observed counts? How
does this compare with goodness-of-fit test for hypothesis 1 in
handout 2?

Jeg forstår ikke hva som gjøres i løsningsforslaget:

The χ2 statistic is calculated via:
> D.H2 <- sum((x-n*Phat.H2)^2/(n*Phat.H2)) ## hva gjøres her?
> D.H2
[1] 5.043348
> pchisq(D.H2,df=1, lower.tail=F) # kan du forklare lower.tail=F ?
[1] 0.02472067
This is <0.025 which makes us reject H0. The model can be rejected.

Hva er the chi-square statistic for the goodness-of-fit test of the
model? og hva menes med å forkaste modellen baser på oberverte counts?
sammenliknes denne modellen med hyp.1 ved å se på p-verdien?

coron

unread,

Apr 23, 2012, 5:10:04 AM4/23/12

to ST2304 2012

Jeg forstår ikke svaret på oppg.5 problem 1 i øving 10 ???

Jarle Tufto

unread,

Apr 29, 2012, 11:56:28 AM4/29/12

to st230...@googlegroups.com

kl. 11:05:25 UTC+2 mandag 23. april 2012 skrev coron følgende:

Hei, jeg lurer på oppgave 4 i problem 1.

4. Compute the chi-square statistic for the goodness-of-fit test of
the model. Can you reject this model based on the observed counts? How
does this compare with goodness-of-fit test for hypothesis 1 in
handout 2?

Jeg forstår ikke hva som gjøres i løsningsforslaget:

The χ2 statistic is calculated via:
> D.H2 <- sum((x-n*Phat.H2)^2/(n*Phat.H2)) ## hva gjøres her?
> D.H2
[1] 5.043348

Her beregnes verdien av testobservatoren D gitt ved ligning (10) i handout 2.

Under H0 (altså at modell H2 er riktg) er denne er kji-kvadrat fordelt med k-1-s frihetsgrader.

Her er antall kategorier k=4 og s=2 (vi estimerer to parametere, allelfrekvensene på hvert loci p_a og p_b) slik at

k-1-s = 1 frihetsgrad.

> pchisq(D.H2,df=1, lower.tail=F) # kan du forklare lower.tail=F ?
[1] 0.02472067

Default er at alle p****-funksjoner beregener sannsynlighet nedenfor oppgitt verdi av den stokastiske variabelen.

Vi ønsker sannsynligheten for at at en kji-kvadratfordelt variabel er _større_ en observert verdi lik D.H2, det er dette

som er p-verdien for testen (altså at testobservatoren tar observert eller mer ekstrem verdi...)

This is <0.025 which makes us reject H0. The model can be rejected.

Hva er the chi-square statistic for the goodness-of-fit test of the
model? og hva menes med å forkaste modellen baser på oberverte counts?
sammenliknes denne modellen med hyp.1 ved å se på p-verdien?

Mens vi kan forkaste H2 (på grunnlag av p-verdi < 0.05) kan vi ikke forkaste H1 (som passer godt til dateene). Og H1 er at blodtype er

bestemt av 3 allel på ett loci slik vi vet det er i dag...

Jarle Tufto

unread,

Apr 29, 2012, 12:08:30 PM4/29/12

to st230...@googlegroups.com

Her er ikke løsningsforslaget riktig. Det er spurt om vi kunne undersøkt

goodness-of-fit hvis vi hadde estimert s=3 i stedet for s=2 parametere i

en situasjon med fortsatt k=4 kategorier. Men da ville vi fått en observert verdi

på D=0 og videre er testobservatoren da kji-kvadratfordelt med k-1-s=0 frihetsgrader. Vi kan si

at vi har brukt opp alle frihetsgradene i dataene (k-1=3) til å estimere like mange parametere s=3.

Dermed er det ikke noe mer variabilitet igjen i dataene til å vurdere hvorvidt modellen passer.

Mer konkret ser vi at siden en kji-kvadratfordelt variabel med n frihetsgrader

kan betraktes som summen av kvadratet av n standardnormalforeldte variable

vil en kji-kvadratfordeling med null frihetsgrader innebære en fordeling med all