O tamanho das bolas ajuda a descobrir quais são as bolas pretas?

7 views
Skip to first unread message

Ricardo Dobrovolski

unread,
Mar 22, 2015, 3:03:58 PM3/22/15
to r-eco...@googlegroups.com, r-...@listas.c3sl.ufpr.br
Oi Pessoal,

Tudo bem?

Suponham que quero descobrir quais são as bolas pretas ("col" = 1) em um conjunto de milhares de bolas. Sei porém que dois fatores podem afetar minha capacidade de adivinhar a cor da bola. Um é conhecido, a rugosidade, bolas rugosas  ("rug" = 1) tendem a ser pretas. Outro é o efeito que quero descobrir, o tamanho da bola ("siz").

Como fazer um teste de aleatorização para avaliar separadamente esses efeitos?

Em anexo, está o arquivo com os dados e uma sugestão de solução do problema, baseado em um teste de aleatorização em que seleciono dentre o conjunto de bolas, aquelas que são rugosas e dentre estas vou selecionando bolas com tamanhos cada vez menores a fim de descobrir se existe efeito do tamanho e qual o tamanho máximo que a bola tem de ter para influir na minha decisão.

Porém, eu tenho dois problemas, o poder do teste de aleatorização, pois quando vou diminuindo o tamanho da bola, meu universo de possibilidades é reduzido. E o outro é o fato de que faço teste para diferentes categorias de tamanho de bola, como extrair uma conclusão geral.

Não sei se alguém vai ter saco de me ajudar, mas isso acontecer, agradeço. Se alguém souber de literatura que trate desses temas, também será bem-vinda.

Abraço,

Ricardo Dobrovolski


balls.txt
function_balls.txt

Bruno Vilela

unread,
Mar 23, 2015, 8:45:54 AM3/23/15
to r-eco...@googlegroups.com
Oi Ricardo,

Por que não aplicar simplesmente uma regressão logística múltipla?

(em anexo o script)
Nesse caso o tamanho tem um efeito negativo sobre a probabilidade de ser uma bola preta, e a rugosidade aumenta a probabilidade de ser preta (ver os coeficientes para interpretar o tamanho do efeito). Não há efeito da interação entre as duas variáveis.

Não sei se era isso que você queria... 


Abraço

Bruno Vilela


Date: Sun, 22 Mar 2015 16:03:56 -0300
Subject: [R-Ecology] O tamanho das bolas ajuda a descobrir quais são as bolas pretas?
From: rdobro...@gmail.com
To: r-eco...@googlegroups.com; r-...@listas.c3sl.ufpr.br
--
Envie um código mínimo reproduzível.
Envie ou responda perguntas para o e-mail (r-eco...@googlegroups.com)
---
Você recebeu essa mensagem porque está inscrito no grupo "R-Ecology" dos Grupos do Google.
Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie um e-mail para r-ecologia+...@googlegroups.com.
Acesse esse grupo em http://groups.google.com/group/r-ecologia.
Para mais opções, acesse https://groups.google.com/d/optout.
script.R

Adriano S. Melo

unread,
Mar 23, 2015, 8:59:18 AM3/23/15
to r-eco...@googlegroups.com
oi Ricardo,
Você disse:
" pois quando vou diminuindo o tamanho da bola, meu universo de possibilidades é reduzido. "
Tamanho é uma variável quantitativa e, portanto, existem infinitos valores num intervalo (mesmo que pequeno).


Me parece que a sugestão do Bruno parece ser mais efetiva.  

abraço,
Adriano

Ricardo Dobrovolski

unread,
Mar 23, 2015, 9:12:59 AM3/23/15
to r-eco...@googlegroups.com
Oi Adriano e Bruno,

Sim, eu sei que tamanho é uma variável quantitativa contínua. Então...?

A solução do Bruno seria óbvia se eu estivesse interessado tanto no 0 quanto no 1. Mas não estou. Só estou interessado em saber o quanto eu acerto quando digo que é 1 (bola preta). Considerando os termos de uma matriz de confusão, estou interessado na precisão do meu modelo.

Abraços,

RD.


Adriano S. Melo

unread,
Mar 23, 2015, 9:27:49 AM3/23/15
to r-eco...@googlegroups.com
oi Ricardo,



Sim, eu sei que tamanho é uma variável quantitativa contínua. Então...?


Basta aumentar o número de casas decimais.
 

A solução do Bruno seria óbvia se eu estivesse interessado tanto no 0 quanto no 1. Mas não estou. Só estou interessado em saber o quanto eu acerto quando digo que é 1 (bola preta). Considerando os termos de uma matriz de confusão, estou interessado na precisão do meu modelo.


Note que é a mesma coisa pois um é o complemento do outro.
Meu livro favorito de lm (e regLogistica; Kutner et al. Applied Linear Statistical Models) oferece 3 sugestões?
1. Use 0.5 como valor de corte. Acima de 0.5 classifique como preto.
2. Encontre um melhor valor de corte avaliando vários valores e decidindo qual melhor classifica os pretos corretamente.
3. Use valores já sugeridos na literatura com ou sem custos. As vezes erra pode ter consequências sérias e, portanto, pode-se incluir custos para mover o valor de corte na outra direção.

abraço,
Adriano 

Ricardo Dobrovolski

unread,
Mar 23, 2015, 9:32:50 AM3/23/15
to r-eco...@googlegroups.com
Oi Adriano,

Perdão, acho que há um ruído, mas tamanho e cor são variáveis independentes. E a relação entre elas é o que eu quero testar.

As bolas pretas ou brancas já estão classificadas e não preciso de um regra para classificá-las, portanto.

Abraço,

RD.

Adriano S. Melo

unread,
Mar 23, 2015, 9:48:29 AM3/23/15
to r-eco...@googlegroups.com
oi Ricardo,
Sim, já tinha entendido estas duas coisas.

A classificação é em relação à previsão do modelo, para avaliar se ele é bom e qual o valor de corte.

abraço,
Adriano

Ricardo Dobrovolski

unread,
Mar 23, 2015, 10:09:22 AM3/23/15
to r-eco...@googlegroups.com
Huuummm. Ok.

Agora entendi. Sorry. Dessa maneira, faço a avaliação da precisão a partir da previsão do modelo.

Da maneira como eu estava pensando, eu olhava direto para os dados e estimava a precisão, dada as características das bolas.

Abraço,

RD.

Adriano S. Melo

unread,
Mar 23, 2015, 10:15:44 AM3/23/15
to r-eco...@googlegroups.com
;-)
Reply all
Reply to author
Forward
0 new messages