>> In termini assoluti nulla. In termini relativi puoi dire rispetto a
>> un'altra nuvola di punti e annesso r2 se descrive una situazione
>> peggiore o migliore.
>
> Mah... Arrivo alla conclusione del topic con pi� confusione rispetto
> all'inizio....
Sai che non riesco a capire che tipo di risposta vuoi?
Hai esordito dicendo: "che significato posso attribuire
all'affermazione: il coefficiente di correlazione � x (0.5, mettiamo) e
il livello di significativit� � y (0.0001, mettiamo)"?
Ho cercato di spiegare che l'affermazione contiene due elementi di tipo
diverso: uno relativo alla misurazione di un fenomeno concreto,
traducibile quantitativamente, l'altro alla misurazione del grado di
certezza sull'esistenza del fenomeno stesso nell'espressione
quantitativa in cui si manifesta concretamente.
In sostanza la tua frase si traduce con:
a) in una scala da 0 a 1, dove 0 si traduce con inesistente e 1 si
traduce con esistente e perfetto, la relazione che ho misurato tra due
caratteri si colloca nel punto 0.5;
b) in un'altra, DIVERSA, scala da 0 a 1, dove 0 indica assoluta certezza
sull'esistenza e 1 indica assoluta certezza sulla inesistenza, sono
"confidente" (perdonami il termine, forse un po' equivoco) che la
relazione esista perch� la probabilit� che non esista (ovvero che la sua
misura secondo la scala di cui al punto precedente) � minore di 0.0001.
Le due cose (descrizione e inferenza) stanno su due piani completamente
diversi; la relazione pu� essere quasi perfetta (quindi il primo indice
pu� valere 0.95, mettiamo) e tu esserne molto dubbioso (e quindi il
secondo indice pu� valore 0.8, mettiamo), oppure la relazione pu� essere
molto debole (e quindi il primo indice pu� valere 0.1, mettiamo) e tu
essere comunque praticamente certo della sua esistenza (e quindi il
secondo indice valere 0.01, mettiamo).
Mi pareva d'avere detto che non voglio impegolarmi in discussioni sul
secondo elemento, e quindi sul punto b), perch� si tratta in sostanza di
interpretare la frase: "ho ottenuto x=0.5 e il mio grado di sicurezza
che non sia x=0 � 0.0001)" (per chi legge la prima volta: no, non � uno
scherzo, purtroppo, mi viene da aggiungere) che richiederebbe fiumi di
pagine per essere spiegata e commentata.
Limitatamente al punto 1, ricordo che r2, come (pressoch�) qualunque
altro indice normalizzato, definisce formalmente ed esattamente la
situazione descritta dal valore 0 e quella descritta dal valore 1. NON
definisce le situazioni intermedie! che ovviamente sono quelle pi�
ricorrenti ed interessanti!
Inoltre, come TUTTI gli indici sintetici, nel riassumere una situazione
complessa e articolata in un solo numero, comporta inevitabilmente una
perdita di informazioni.
Ecco perch� tu, che sei l'unico a conoscere la descrizione esatta e
completa della situazione, rappresentata dal grafico della nuvola dei
punti, non puoi chiedere a me come devi interpretare r2=0.5!!!
Io, da perfetto estraneo, ho cercato di risponderti che soli due termini
che conosco:
1) riconduci (con tutti i limiti, e ce ne sono, che questa operazione
comporta!!!) il tuo caso concreto a uno ideale, e giudica quest'ultimo.
Per esempio r2=0.5 corrisponde ad avere una x estratta da una normale
standard e una y estratta da una normale standard traslata di x (per
inciso, in uno dei miei messaggi precedenti ho sbagliato a fare i conti,
perch� ho parlato di N(1,1) quando doveva essere N(2,1)). Riesci a
costruire un'immagine mentale del caso che ho descritto, per giudicare
il livello di sovrapponibilit� delle diverse curve di y e vedere in che
misura soddisfa le tue esigenze di riconoscibilit�?
2) confronti il tuo caso concreto con altri analoghi, valutando i valori
di r2 ad essi associati. Se per esempio hai un altro r2=0.7, allora la
tua situazione � peggiore; se invece hai un altro r2=0.3, allora la tua
situazione � migliore. Ecco perch� ti avevo chiesto se c'erano tecniche
alternative a quella di tuo interesse.
Mi dispiace ma non mi vengono in mente altri tipi di risposte. Anzi, per
me non ce ne sono proprio. Temo che se ti aspettavi di pi� il tuo
problema sia destinato a rimanere irrisolto.
> Per quello sono estremamente interessato a metodi quantitativi di
> interpretazione delle immagini mediche (che prima dicevi di conoscere
> e ora no). Perch� � un po' come il sacro graal. Sarebbe ovviamente
> ultra-utile.... ma non c'� idea di come fare!
Non mi pare proprio d'avere detto una cosa del genere. Se l'ho fatto, ho
commesso un errore vistoso. Non mi occupo di medicina nucleare. Nel mio
campo, che mi pare molto pi� agevole del tuo, la gravit� di una malattia
si giudica misurando a occhio l'entit� di una certa massa. La stessa
massa per medici diversi pu� risultare "mild" e per altri "severe", per
cui alla fine si preferisce descrivere la situazione indirettamente
misurando, per esempio, un parametro preso dalle analisi del sangue.
Tutto qui.
>> Per te N(0,1) e N(e,1) sono diverse anche quando e=10^-10?
>
>
> Ma questo � un problema totalmente separato dalla statistica!!
> Una comune applicazione della fisica nucleare � misurare la
> concentrazione di un qualche elemento extra-raro in un campione.
> Questa si manifesta tipicamente con un incremento di una qualche
> grandezza di un infinitesimo rispetto al fondo. Han rilevanza pratica
> incrementi dello 0.1 per mille? Che ne so...e soprattutto....me ne
> importa? Se parlo di statistica il mio unico problema � essere sicuro
> che si possa escludere che quell'incremento di un niente sia dovuto al
> fondo.
>
> Quindi posso dire che sono diverse eccome N(0,1) e N(e,1) per ogni e,
> se � il caso.
Premetto che non so assolutamente nulla di fisica. Per� non sono
d'accordo sulla tua affermazione iniziale, e per me continua ad esserci
un fraintendimento, per cui mi sento di fare due osservazioni:
1) Non mi risulta che esistano strumenti mdi misura con un grado di
precisione assoluto. Quindi, se per esempio il tuo strumento di misura
rileva al pi� variazioni di 10^-10, allora non ha alcun senso chiedersi
se esiste un segnale di intensit� media pari a 10^-20.
2) La fisica nucleare non � la medicina. In medicina, se esiste un
problema come quello da te descritto, riguarda un numero
trascurabilissimo di situazioni. Prova a chiedere a qualunque medico di
valutare l'efficacia di un farmaco che funziona nel 50% dei casi
rispetto a quella di un altro farmaco che funziona nel 50,5% dei casi.
In altre parole, considera la "rilevanza clinica" come uno strumento di
misura che (molto, molto, molto) difficilmente scender� sotto la soglia
dell'1%.
> Altrimenti l'unico problema pratico della sovrapposizione � che
> maggiore � pi� risulta difficile garantire che effettivamente siano
> distinte. Infatti se mi interessa solo sapere se A e B sono "diverse"
> allora possono anche essere assai sovrapposte, che l'unico mio
> problema sar� raccogliere abbastanza N ed escludere sistematici.
> Ed una differenza di una deviazione standard tra le due medie �
> abbastanza facile da individuare.
Idem come prima. Tutto a questo mondo � correlato. E tutto � diverso.
Negli studi clinici dove l'output principale � il tasso di risposta dei
pazienti, generalmente si prende come soglia per dimostrare
l'equivalenza di due diversi trattamenti il valore del 15%. Ovvero una
differenza inferiore al 15% viene considerata non clinicamente
rilevante, sebbene "diversa", come scrivi tu.