lower.tail

10 views
Skip to first unread message

GPO

unread,
Jun 1, 2011, 8:20:38 AM6/1/11
to ST2304 Statistical Modelling for Biologists/Biotechnologists
Oppdaget plutselig at jeg har misforstått litt ang bruk av lower.tail
når kvantilene skal finnes (eks qchisq, osv), og nå er jeg litt
forvirra over når jeg skal bruke de ulike argumentene og hva som
finner hva..
Tror også jeg blander mht ensidige- og tosidige tester... hvis det er
mulig?


- Når setter vi inn verdier for hhv alfa eller alfa/2 / 1-alfa/2 som
argument?

- Hva er det egentlig lower.tail=F/T styrer?


(trodde opprinnelig dette styrte det jeg spør om i forrige punkt, slik
at følgende to kommandoer ville gi samme verdi/resultat

> qchisq(0.975,df=12)
[1] 23.33666
> qchisq(0.05,df=12,lower.tail=F)
[1] 21.02607

men det gjør de jo ikke, så her er det er det tydelig noe jeg ikke har
skjønt...)

Jisca

unread,
Jun 1, 2011, 8:27:51 AM6/1/11
to ST2304 Statistical Modelling for Biologists/Biotechnologists
Hey,
I don't think you were so far off:

> qchisq(0.05,df=12)
[1] 5.22603
> qchisq(0.95,df=12)
[1] 21.02607
> qchisq(0.95,df=12,lower.tail=F)
[1] 5.22603
> qchisq(0.05,df=12,lower.tail=F)
[1] 21.02607

By default the value is returned which has a proportion 'x' of the
distribution at the lower (left) side of it.

- You divide alpha by 2 when you have a two-sided test, so you're
basically doing two tests (one on either side), each with alpha/2, so
that the total alpha is what you want.

GPO

unread,
Jun 1, 2011, 9:30:01 AM6/1/11
to ST2304 Statistical Modelling for Biologists/Biotechnologists
Okei,
da løsnet det litt...!

Men, når er det vi bruker tosidige tester i kjikvadrat-fordelingen?
Så det kom inn i den ene prøve-eksamensoppgaven når vi skulle se om vi
hadde over- eller underdispersjon i dataene (siden Residual Deviance
er kjikvadrat), men har vi andre eksempler? Synes "lower.tail=F"-
argumentet er blitt brukt hele tiden gjennom alle øvingene...?
> > skjønt...)– Skjul sitert tekst –
>
> – Vis sitert tekst –

Jisca

unread,
Jun 1, 2011, 11:17:47 AM6/1/11
to ST2304 Statistical Modelling for Biologists/Biotechnologists
Ah, sorry, I wasn't totally clear I realize. "lower.tail=F" means that
it won't use the lower (left) tail, but instead will use the upper
(right) tail . It is still a one-sided test. The values in the tables
(tabeller og formler i statistikk) are P(X > x_alpha), thus the values
that you get when you use "lower.tail=F".

Some tests you can tell that you want a two-sided test, e.g.
"t.test(x,y, alternative = "two.sided") and use alpha, but when
you're using a Chi-square or other distribution, you'll need to half
alpha yourself.

Jarle Tufto

unread,
Jun 1, 2011, 11:18:35 AM6/1/11
to ST2304 Statistical Modelling for Biologists/Biotechnologists
Når vi tester om en bestemt forklaringsvariabel har en signifikant
effekt i en generalisert lineær modell bruker vi endring i devians D_0
- D_1 som testobservator. Under H_0 er denne testobservatoren
tilnærmet kji-kvadrat fordelt. Det er hvis denne endringen er stor
(fordi utvidet modell passer mye bedre) at vi konkluderer med at den
utvidede modellen er best og i slike situasjoner ligger
forkastningsområdet i øvre hale av fordelingen.

For goodness-of-fit tester (hvor godt passer en modell til dataene?)
er det normalt også øvre del av kji-kvadratfordelingen vi bruker som
forkastningsområdet. Men det kan også være interessant å se på om
modellen passer bedre enn hva vi kan forventet ut i fra
tilfeldigheter. Se for eksemel

http://www.forskning.no/artikler/2002/juni/1024572829.67

og

http://www.upress.pitt.edu/htmlSourceFiles/pdfs/9780822959861exr.pdf

Vi bruker samme type test for å se på om vi har under- eller over-
dispersjon. Over-dispersjon er mer en regel enn et unntak.
Underdispersjon er derimot er veldig uvanlig.

On Jun 1, 3:30 pm, GPO <preus...@stud.ntnu.no> wrote:
Reply all
Reply to author
Forward
0 new messages