Øving 10

27 views
Skip to first unread message

coron

unread,
Apr 23, 2012, 5:05:25 AM4/23/12
to ST2304 2012
Hei, jeg lurer på oppgave 4 i problem 1.

4. Compute the chi-square statistic for the goodness-of-fit test of
the model. Can you reject this model based on the observed counts? How
does this compare with goodness-of-fit test for hypothesis 1 in
handout 2?

Jeg forstår ikke hva som gjøres i løsningsforslaget:

The χ2 statistic is calculated via:
> D.H2 <- sum((x-n*Phat.H2)^2/(n*Phat.H2)) ## hva gjøres her?
> D.H2
[1] 5.043348
> pchisq(D.H2,df=1, lower.tail=F) # kan du forklare lower.tail=F ?
[1] 0.02472067
This is <0.025 which makes us reject H0. The model can be rejected.

Hva er the chi-square statistic for the goodness-of-fit test of the
model? og hva menes med å forkaste modellen baser på oberverte counts?
sammenliknes denne modellen med hyp.1 ved å se på p-verdien?

coron

unread,
Apr 23, 2012, 5:10:04 AM4/23/12
to ST2304 2012
Jeg forstår ikke svaret på oppg.5 problem 1 i øving 10 ???

Jarle Tufto

unread,
Apr 29, 2012, 11:56:28 AM4/29/12
to st230...@googlegroups.com
kl. 11:05:25 UTC+2 mandag 23. april 2012 skrev coron følgende:
Hei, jeg lurer på oppgave 4 i problem 1.

4. Compute the chi-square statistic for the goodness-of-fit test of
the model. Can you reject this model based on the observed counts? How
does this compare with goodness-of-fit test for hypothesis 1 in
handout 2?

Jeg forstår ikke hva som gjøres i løsningsforslaget:

The χ2 statistic is calculated via:
> D.H2 <- sum((x-n*Phat.H2)^2/(n*Phat.H2)) ## hva gjøres her?
> D.H2
[1] 5.043348

Her beregnes verdien av testobservatoren D gitt ved ligning (10) i handout 2.  
Under H0 (altså at modell H2 er riktg) er denne er kji-kvadrat fordelt med k-1-s frihetsgrader.  
Her er antall kategorier k=4 og s=2 (vi estimerer to parametere, allelfrekvensene på hvert loci p_a og p_b) slik at
k-1-s = 1 frihetsgrad.
 
> pchisq(D.H2,df=1, lower.tail=F) # kan du forklare lower.tail=F ?
[1] 0.02472067

Default er at alle p****-funksjoner beregener sannsynlighet nedenfor oppgitt verdi av den stokastiske variabelen.  
Vi ønsker sannsynligheten for at at en kji-kvadratfordelt variabel er _større_ en observert verdi lik D.H2, det er dette 
som er p-verdien for testen (altså at testobservatoren tar observert eller mer ekstrem verdi...)
 
This is <0.025 which makes us reject H0. The model can be rejected.

Hva er the chi-square statistic for the goodness-of-fit test of the
model? og hva menes med å forkaste modellen baser på oberverte counts?
sammenliknes denne modellen med hyp.1 ved å se på p-verdien?

Mens vi kan forkaste H2 (på grunnlag av p-verdi < 0.05) kan vi ikke forkaste H1 (som passer godt til dateene).  Og H1 er at blodtype er
bestemt av 3 allel på ett loci slik vi vet det er i dag...

Jarle Tufto

unread,
Apr 29, 2012, 12:08:30 PM4/29/12
to st230...@googlegroups.com
Her er ikke løsningsforslaget riktig.  Det er spurt om vi kunne undersøkt 
goodness-of-fit hvis vi hadde estimert s=3 i stedet for s=2 parametere i 
en situasjon med fortsatt k=4 kategorier.  Men da ville vi fått en observert verdi 
på D=0 og videre er testobservatoren da kji-kvadratfordelt med k-1-s=0 frihetsgrader.  Vi kan si
at vi har brukt opp alle frihetsgradene i dataene (k-1=3) til å estimere like mange parametere s=3.  
Dermed er det ikke noe mer variabilitet igjen i dataene til å vurdere hvorvidt modellen passer.

Mer konkret ser vi at siden en kji-kvadratfordelt variabel med n frihetsgrader 
kan betraktes som summen av kvadratet av n standardnormalforeldte variable 
vil en kji-kvadratfordeling med null frihetsgrader innebære en fordeling med all 
sannsynlighetsmassen lokalisert i null.  Så dermed bryter testen 
sammen (vi får alltid p-verdi lik P(D>=0) = 1...)
Reply all
Reply to author
Forward
0 new messages