Øving 11

31 views
Skip to first unread message

Christoffe

unread,
Mar 21, 2012, 8:41:41 AM3/21/12
to ST2304 2012
Sliter litt med Øving 11 oppg 3,1

1. Compute the MLEs of each pi, that is, ^p1; ^p2; : : : ; ^pn under
the full model and store the
result in a vector phat.

Noken tips ?

Jarle Tufto

unread,
Mar 21, 2012, 9:46:35 AM3/21/12
to st230...@googlegroups.com
Den fulle modellen er en modell med like mange parametere som observasjoner (p = n).   Om vi f.eks. inkluderer n-1 forklaringsvariable i en modell vil du ha totalt p=n parametere (én intercept beta0 + n-1 regresjonskoeffisienter, beta1, beta2,...).  I stedet for å jobbe med beta0, beta1, o.s.v. som parametere kan vi reparameterisere den fulle modellen ved å bruke p1, p2, ..., pn som parametere, altså sannsynlighetene for suksess for observasjon 1, 2, ...,n.  Det er da lett å vise at SME av p1, p2, ..., pn da blir observert antall suksesser delt på totalt antall delforsøk for observasjon 1,2,....,n.  Disse tallene ligger i vektoren x og n når du har lastet inn dataene fra ovul2.dat.  Så da regner du bare ut hatp1, hatp2, o.s.v. ved å skrive

phat <- x/n

Christoffe

unread,
Mar 21, 2012, 11:13:08 AM3/21/12
to ST2304 2012
Takk!

Et spørsmål til:

Rekner ut D ved å bruke D <-2*((fit1$value) - (fit2$value))
der fit1 er den fulle modellen og fit 2 er modellen fra øving 10.
Får da -90.16523, stemmer dette?
Og hvilken verdi er det egentlig en forventer å få her ? Får antall
frihetsgrader til å bli 49 - 2, og qchisc blir da 64, som jo er langt
fra -90.

Jarle Tufto

unread,
Mar 21, 2012, 11:26:28 AM3/21/12
to st230...@googlegroups.com
I øving 11 er det deviansen til modellen med 3 parameter q, beta0 og beta1 vi skal regne ut.  Deviansen er definert som

D = 2(lnLfull - lnL)

hvor lnL er maksimal likelihood under den tilpassede modellen (d.v.s -fit2$value (merk skifte av fortegn).  Maksimalt log likelihood under den fulle modellen lnLfull trenger du ikke bruke optim for å beregne fordi SME av hver pi er hat pi = xi / ni.  I dette punktet i parameterrommet har log likelihood funksjonen sitt maksimum og log likelihoodet har verdi gitt ved ligning 23 i notat 5, men dette uttrykket vil ikke fungere hvis noen av pi'ene er null (for da får vi log(0)=-Inf)..  Så i praksis er det bedre å bruke uttrykket 

sum(dbinom(x,size=n,prob=phat,log=T))

som beregner akkurat det samme.  Under nullhypotesen at modellen er riktig er D er kji-kvadratfordelt med n - p frihetsgrader (forskjell i antall estimerte parametere under tilpasset og full modell).  Forventningsverdien til en kji-kvadratfordeltvariabel er lik antall frihetsgrader (dette følger av at summen av kvadratet til k standardnormalfordelte variable er kji-kvadratforelt med k frihetsgrader).
Reply all
Reply to author
Forward
0 new messages