Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

TEST.CHI

2 views
Skip to first unread message

y

unread,
Apr 3, 2004, 3:42:04 AM4/3/04
to
Ciao,
c'é qualcuno che usa questa funzione?

Ho provato ad usarla tout-court ma ottenevo risultati un po' strani.

Mi sono costruito il test chi² da me (matricialmente!) e i risultati
differiscono da quelli sopra. Sapete come utilizzare allora la funzione
TEST.CHI?

Se qualcuno poi macina questi argomenti vorrei chiedergli come
implementare la teoria con Excel, magari in pvt.

Grazie,

Alessandro.

P.S.

Il NG non è replicato da tutti i server news, sapete dirmi un server
news raggiungibile da qualsiasi indirizzo IP e dominio con il quale
partecipare a M.P.I.O.E. ?

Ri-ciao.

lucia

unread,
Apr 3, 2004, 10:57:20 AM4/3/04
to

"y" <y@y.t> ha scritto

>.
>

Premetto che non uso excel per questo tipo di analisi.

Ho replicato su altri applicativi l'esempio che c'è
nell'help di excel, ottenendo lo stesso identico
risultato. Non ho fatto altre prove.

In excel:
Seguendo l'esempio, se i dati sono costituiti da una
variabile con n modalita' e un'altra con m modalita',
costruisci prima la matrice nxm delle frequenze.
Seguendo la teoria, calcoli la matrice delle frequenze
congiunte teoriche.
Utilizzi la funzione sui due intervalli.

Se hai qualche domanda specifica falla pure, ma non in
privato.

ciao
lucia

Maurizio Borrelli

unread,
Apr 3, 2004, 11:55:09 AM4/3/04
to
"y" <y@y.t> ha scritto nel messaggio
news:wNubc.108410$FJ6.3...@twister1.libero.it...
[...]

P.S.
Il NG non è replicato da tutti i server news, sapete dirmi un server
news raggiungibile da qualsiasi indirizzo IP e dominio con il quale
partecipare a M.P.I.O.E. ?

RISPOSTA:

Ciao, Alessandro.

Penso che possa andar bene:

news.microsoft.com

--
Ciao :o)
Maurizio Borrelli, Microsoft MVP - Office System - Access
--------
?SPQR(C)
X
--------


y

unread,
Apr 3, 2004, 12:12:54 PM4/3/04
to

> Premetto che non uso excel per questo tipo di analisi.
>
> Ho replicato su altri applicativi l'esempio che c'è
> nell'help di excel, ottenendo lo stesso identico
> risultato. Non ho fatto altre prove.
>
> In excel:
> Seguendo l'esempio, se i dati sono costituiti da una
> variabile con n modalita' e un'altra con m modalita',
> costruisci prima la matrice nxm delle frequenze.
> Seguendo la teoria, calcoli la matrice delle frequenze
> congiunte teoriche.
> Utilizzi la funzione sui due intervalli.
>
> Se hai qualche domanda specifica falla pure, ma non in
> privato.

Spero di non dare fastidio al NG, forse dovremmo spostarci su qualche NG
di statistica, ma di gruppi in italiano non è ho trovati.

Comunque io ho in L6:L9 le frequenze normalizzate per le 4 classi dei
miei dati. In O6:O9 le frequenze derivanti dalla distribuzione WEIBULL
con 2 particolari valori dei parametri alfa e beta. Quindi in L i dati
osservati e raggruppati e in O quelli attesi.

in O15 ho inserito la formula TEST.CHI(L6:L9;O6:O9) ed ho moltiplicato
per la numerosità dei dati osservati.

Facendo a mano i conti ho scritto in O26:O30 con _formula matriciale_ la
formula:

=SE((O$6:O$9)<>"";((($J$6:$J$9)-$H$5*(O$6:O$9))^2)/$J$6:$J$9;"")

la condizione mi evita di avere dei #DIV/0 se in O6:09 non disponibili
dati. Comunque nello specifico tutti gli intervalli di cui parlo
contengono un valore numerico.

Poi ho sommato i valori presenti in O26:O30.

I 2 risultati sono diversi.

Alessandro.

P.S.
Uscendo dal seminato vorrei anche chiedere informazioni sulla tecnica di
usare di una popolazione di dati metà insieme come classe di
"allenamento" o "training" e l'altra metà di "verifica" o "verification"
sempr econ il metodo del X².

Me lo sono fatto spiegare dal prof. ma non ho ben capito.

Ciao Alessandro.

lucia

unread,
Apr 4, 2004, 5:14:41 AM4/4/04
to
"y" <y@y.t> ha scritto

Non ho inquadrato bene il caso. Prova a fornire ulteriori
informazioni:
Qual e' l'obiettivo del lavoro?
Come sono fatti i dati originali: numero e tipo di
variabili, numero di osservazioni, puoi fare un esempio?
Come sono fatti i dati in L6:L9 e O6:O9, puoi fare un
esempio?
Come calcoli i valori della Weibull?
Cosa c'e' nell'intervallo j6:j9? E in h5?


>Alessandro.
>
>P.S.
>Uscendo dal seminato vorrei anche chiedere informazioni
sulla tecnica di
>usare di una popolazione di dati metà insieme come classe
di
>"allenamento" o "training" e l'altra metà di "verifica"
o "verification"
>sempr econ il metodo del X².
>
>Me lo sono fatto spiegare dal prof. ma non ho ben capito.
>
>Ciao Alessandro.
>

Qui penso che sei effettivamente fuori tema oltre che un
po' vago nel descrivere quello che vuoi. Provo ad
interpretare: "training set" , "evaluation
set", "validation set" sono usati in numerose tecniche di
data mining. Una di queste tecniche, nell'ambito degli
alberi decisionali, e' il CHAID, che si basa sul chi-
quadrato.
Prova a fare una ricerca sul web utilizzando quelle parole
chiave.

ciao
lucia

y

unread,
Apr 4, 2004, 9:54:03 AM4/4/04
to
Ho un file di esempio pronto. Come te lo faccio vedere?

Si possono mettere allegati sul newsgroup?

Non posso includere testo HTML nelle mail perché l'hanno sconsigliato.

Inoltre no si vedrebero le formule che sono il quid.

Che faccio?

Grazie molte per le keyword. Alex.

lucia wrote:

>
> Non ho inquadrato bene il caso. Prova a fornire ulteriori
> informazioni:
> Qual e' l'obiettivo del lavoro?
> Come sono fatti i dati originali: numero e tipo di
> variabili, numero di osservazioni, puoi fare un esempio?
> Come sono fatti i dati in L6:L9 e O6:O9, puoi fare un
> esempio?
> Come calcoli i valori della Weibull?
> Cosa c'e' nell'intervallo j6:j9? E in h5?

>

lucia

unread,
Apr 4, 2004, 11:12:48 AM4/4/04
to
"y" <y@y.t> ha scritto

>Ho un file di esempio pronto. Come te lo faccio vedere?
>
>Si possono mettere allegati sul newsgroup?
>
>Non posso includere testo HTML nelle mail perché l'hanno
sconsigliato.
>
>Inoltre no si vedrebero le formule che sono il quid.
>
>Che faccio?
>

Preferisco continuare la discussione sul newsgroup. Cerca
di spiegare a parole, riproduci qualche riga e soprattutto
rispondi alla prima domanda: cosa vuoi fare coi dati? qual
e' l'obiettivo? (il fine non puo' essere fare il test,
quello semmai e' uno strumento per arrivarci).

Se proprio non riesci ad (non hai voglia di) esprimerti,
posta un indirizzo email al quale possa risponderti, ci
daro' un'occhiata.

ciao
lucia

y

unread,
Apr 4, 2004, 12:20:21 PM4/4/04
to
Ti ho spedito il file in pvt ma solo per avere l'esempio davanti. Per me
possiamo continuare la discussione sul NG.
Il mio indirizzo è:

s7 A2A14 7A@s tuA d .u nAit As.i At

togli spazi e le A per ricavare l'indirizzo esatto. Comunque è quello da
cui ti ho spedito l'esempio.

lucia wrote:
> "y" <y@y.t> ha scritto
[CUT]


> Preferisco continuare la discussione sul newsgroup. Cerca
> di spiegare a parole, riproduci qualche riga e soprattutto
> rispondi alla prima domanda: cosa vuoi fare coi dati? qual
> e' l'obiettivo? (il fine non puo' essere fare il test,
> quello semmai e' uno strumento per arrivarci).

Io ho una serie di dati che indicano i tempi intercorrenti tra un guasto
ed un altro in centri di lavorazione di una fabbrica. La seconda serie
di dati rappresenta i tempi di ripristino una volta che un guasto è
occorso. Le funzioni di distribuzione usate in quuesti casi sono la
weibull e la esponenziale negativa. Vorrei fare un test anche con la
gamma poiché visivamente mi sembra che ricordino quell'andamento.

Il mio problema è innanzitutto sapere come usare la funzione TEST.CHI
perché mi evita di usare delle zone di appoggio e mi semplifica la
disposizione dei dati sul foglio.

La scelta della funzione di distribuzione e i suoi parametri sono
l'obiettivo del mio foglio elettronico.

>
> Se proprio non riesci ad (non hai voglia di) esprimerti,
> posta un indirizzo email al quale possa risponderti, ci
> daro' un'occhiata.

Grazie molte.
Alessandro.

lucia

unread,
Apr 5, 2004, 4:34:44 AM4/5/04
to

"y" <y@y.t> ha scritto

>
>Io ho una serie di dati che indicano i tempi
intercorrenti tra un guasto
>ed un altro in centri di lavorazione di una fabbrica. La
seconda serie
>di dati rappresenta i tempi di ripristino una volta che
un guasto è
>occorso. Le funzioni di distribuzione usate in quuesti
casi sono la
>weibull e la esponenziale negativa. Vorrei fare un test
anche con la
>gamma poiché visivamente mi sembra che ricordino
quell'andamento.
>
>Il mio problema è innanzitutto sapere come usare la
funzione TEST.CHI
>perché mi evita di usare delle zone di appoggio e mi
semplifica la
>disposizione dei dati sul foglio.
>
>La scelta della funzione di distribuzione e i suoi
parametri sono
>l'obiettivo del mio foglio elettronico.
>


Ho ricevuto il file, c'e' solo una serie di dati. Non due.
Comunque per capire e' sufficiente.
Per quanto riguarda i parametri della distribuzione
teorica, questi li ho considerati dati, come avevi detto
nella precedente richiesta e come sono nel foglio che mi
hai inviato.

La distribuzione chi-quadrato è molto usata e diversi sono
i test che si adottano, dipende dall'obiettivo
dell'analisi.
La funzione TEST.CHI di excel e' un test di indipendenza
fra due caratteri. Come scritto nell'help, il test ha una
certa formula e i gradi di liberta' sono (n. di righe - 1)*
(n. di colonne - 1).

Il tuo caso e' differente: tu hai un campione (la tua
serie di dati) e vuoi sapere se questo proviene da una
certa popolazione con legge nota (es Weibull) e con
parametri noti (altrimenti li dovresti stimare, ma questa
e' un altra questione).
Serve un test di conformita', e' sempre un chi-quadrato,
pero' la statistica test e' diversa: e' la somma in i
(modalita' del carattere) di [(Ni-Pi*N)^2]/(N*Pi), dove Ni
sono le numerosita' empiriche, Pi e' la probabilita' che
si presenti la modalita' i nella popolazione, N sono le
osservazioni. I gradi di liberta' del test sono pari al
numero delle modalita' - 1 (se stimi dei parametri perdi
altri gradi di liberta').

Morale: non puoi usare la funzione TEST.CHI !
Non credo che excel abbia gia' implementato il test di
conformita'. I calcoli sono peraltro piuttosto semplici.
Nel foglio che ti rimandero' andro' a scrivere in pratica
quello che ho appena spiegato.
Comunque, se conosci un minimo di VBA, puoi implementare
facilmente la funzione che fa al caso. Altrimenti puoi
sempre chiedere aiuto.

Per chi fosse interessato, il link seguente e' un caso
analogo per il test chi quadro di conformita'

http://www.di.unipi.it/di/groups/optimize/Courses/Simulazi/
Esercitazioni/Analisi_Dati_Input.xls

Il seguente e' un semplice esempio del test chi quadro di
indipendenza (TEST.CHI)

http://conover.ba.ttu.edu/PNS3_Excel_files/Chapter_4/Exampl
e%204.2.2.xls

ciao
lucia

y

unread,
Apr 5, 2004, 10:15:22 AM4/5/04
to
> Ho ricevuto il file, c'e' solo una serie di dati. Non due.

Avevo fatto un esempio.

> Comunque per capire e' sufficiente.

[CUT]


> Il tuo caso e' differente: tu hai un campione (la tua
> serie di dati) e vuoi sapere se questo proviene da una
> certa popolazione con legge nota (es Weibull) e con
> parametri noti (altrimenti li dovresti stimare, ma questa
> e' un altra questione).

Visto che devo anche stimare i parametri il prof. mi consigliato infatti di dividere l'intera
popolazione (ipotizzata di valori i.i.d ) in una classe training ed una validation.

Io supponevo di fare il test chi² per entrambe le classi e vedere quale coppia di parametri avrebbe
presentato valori di chi² il più possibile simili (non migliori). Quella coppia avrebbe
caratterizzato la distribuzione adatta a me.

> Serve un test di conformita', e' sempre un chi-quadrato,
> pero' la statistica test e' diversa: e' la somma in i
> (modalita' del carattere) di [(Ni-Pi*N)^2]/(N*Pi), dove Ni
> sono le numerosita' empiriche, Pi e' la probabilita' che
> si presenti la modalita' i nella popolazione, N sono le
> osservazioni. I gradi di liberta' del test sono pari al
> numero delle modalita' - 1 (se stimi dei parametri perdi
> altri gradi di liberta').

> Morale: non puoi usare la funzione TEST.CHI !

E' il tipo di risposta che desideravo!

> Non credo che excel abbia gia' implementato il test di
> conformita'. I calcoli sono peraltro piuttosto semplici.
> Nel foglio che ti rimandero' andro' a scrivere in pratica
> quello che ho appena spiegato.
> Comunque, se conosci un minimo di VBA, puoi implementare
> facilmente la funzione che fa al caso. Altrimenti puoi
> sempre chiedere aiuto.

Avevo approntato una formula matriciale. Con VBA mi risparmio "matriciali" e spazio su foglio.

Grazie, Alex.

lucia

unread,
Apr 5, 2004, 1:21:26 PM4/5/04
to

"y" <y@y.y> ha scritto


>Visto che devo anche stimare i parametri il prof. mi
consigliato infatti di dividere l'intera
>popolazione (ipotizzata di valori i.i.d ) in una classe
training ed una validation.
>
>Io supponevo di fare il test chi² per entrambe le classi
e vedere quale coppia di parametri avrebbe
>presentato valori di chi² il più possibile simili (non
migliori). Quella coppia avrebbe
>caratterizzato la distribuzione adatta a me.
>

Magari ti rispondo in privato, questo non ha piu' a che
fare col ng.


>> Morale: non puoi usare la funzione TEST.CHI !
>
>E' il tipo di risposta che desideravo!
>

Qui voglio specificare: all'inizio avevi scritto di aver
ottenuto due risultati diversi fra uso di TEST.CHI e la
tua formula matriciale. In realta' il risultato numerico
e' diverso per la diversita' delle due formule di calcolo,
pero' il significato e' lo stesso, essendoci una relazione
matematica fra i due risultati: se in A1 c'e' il risultato
di TEST.CHI, se in A2 utilizzi INV.CHI(A1;gradi di
liberta') ottieni proprio il risultato della tua formula.
Viceversa, se in A3 scrivi DISTRIB.CHI(A2; gradi di
liberta') ottieni il risultato di TEST.CHI.

>> Non credo che excel abbia gia' implementato il test di
>> conformita'. I calcoli sono peraltro piuttosto semplici.
>> Nel foglio che ti rimandero' andro' a scrivere in
pratica
>> quello che ho appena spiegato.
>> Comunque, se conosci un minimo di VBA, puoi
implementare
>> facilmente la funzione che fa al caso. Altrimenti puoi
>> sempre chiedere aiuto.
>
>Avevo approntato una formula matriciale. Con VBA mi
risparmio "matriciali" e spazio su foglio.
>

Da quanto detto sopra mi correggo: non e' necessario ne'
VBA ne' matriciali: se vuoi ottenere lo stesso risultato
della tua formula matriciale scrivi direttamente in A1
INV.CHI((TEST.CHI(INTERVALLO1;INTERVALLO2);gradi di
liberta')


ciao
lucia

0 new messages