Re: Øving 10

31 views
Skip to first unread message

Jarle Tufto

unread,
Apr 11, 2012, 7:43:32 AM4/11/12
to st230...@googlegroups.com
Den 23:51 10. april 2012 skrev Gaston Courtade
<gaston...@gmail.com> følgende:
> Hei, trenger litt hjelp med problem 2, spørsmål 1.
> Bruker man pnorm for å beregne p? er det:
> p <- pnorm(y, mean=-1*beta0/beta1, sd=1/beta1) ?

Sammenhengen mellom p_i'ene (sannsynlighet for at ovulasjon har funnet
sted) og x_i'ene (tidspunktet ulike individ er observert (skutt under
jakten)) er at

probit p_i = beta0 + beta1 x_i

Isolerer vi p_i på venstre side i ligningen får vi hver

p_i = phi(beta0 + beta1 x_i)

hvor phi er standard kumulativ normalfordeling (altså en
normalfordeling med forventning null og varians 1). Alle slike
kumulative fordelinger har navn p.... i R. Du beregner derfor p_i'ene
i R med uttrykket

p <- pnorm(beta0 + beta1*x)

altså uten å oppgi argumentene mean og sd slik at disse tar sine
defaultverdier på 0 og 1.

> Hvor kan jeg finne likelihood funksjon til probit? Er dette også pnorm?

Resten av funksjonen skriver du stort sett på samme måte som i handout
5 men husk at hver observasjon nå involverer flere delforsøk
(bernoulli trials).

Tambur

unread,
Apr 11, 2012, 3:57:33 PM4/11/12
to ST2304 2012
Er det meningen at estimatene for beta0 og beta1 skal bli helt
identisk med verdiene fra oppg.7 som benytter glm() ? Og verdiene
forandrer seg litt avhengig av startverdiene til parameterene, er det
noen startverdier som er "bedre" enn noe annet?

Og i oppg. 2.2/2.3 får jeg
$hessian
[,1] [,2] [,3]
[1,] 0 0 0.000
[2,] 0 0 0.000
[3,] 0 0 2917.828

noe som ikke ser helt riktig ut. sqrt(diag(solve(fit$hessian))) gir
også bare en error-melding: "Error in solve.default(fit$hessian) :
Lapack routine dgesv: system is exactly singular"

Jarle Tufto

unread,
Apr 11, 2012, 4:31:29 PM4/11/12
to st230...@googlegroups.com
I oppgave 2.1 skal estimatene bli helt like siden parameterne i en generalisert lineær modell estimeres v.h.a. sannsynlighetsmaksimering.  Det kan være at det blir noen små forskjeller med det skyldes bare at beregningene gjøres med en viss endelig numerisk nøyaktighet.

I oppgave 2.2 kan det være at optimingsalgoritmen (om du bruker uheldige startverdier) ikke greier å "lete seg fram til" likelihoodfunksjonens maksimum men at algoritmen i stedet kjører seg fast i et område i parameterrommet hvor likelihoodet er flatt i visse retninger (en slags "fjellrygg").  Den hessiske matrisa som du får ut tyder nettopp på at det har skjedd - langs diagonalen har du de annenderiverte til lnL m.h.p. beta0 og beta1 som er null, m.a.o. er likelihoodfunksjonen tilnærmet helt flat i beta0 og beta1 retningene.  Står litt om dette i løsningsforslaget.  

Hvis du estimerer parameterne "by eye" og bruker dette som startverdier vil det fungere bedre, i hvert fall for parameteren q.  Også kan du bruke estimatene av beta0 og beta1 i den  enklere modellen (den uten ekstra parameter q) som startverdier for beta0 og beta1.
Reply all
Reply to author
Forward
0 new messages