--
Felipe.
Em Tuesday 25 November 2008 23:05:39 EliasGabriel escreveu:
> Hoje estou
> conseguindo jogar apenas um cartão com 6 dezenas e ter um acerto de 2
> a 3 dezenas.
Note que, além do que foi falado pelos outros membros da lista (ie,
este é um processo estocástico sem correlação temporal, ou seja, é
teoricamente impossível você prever resultados futuros baseado em
resultados passados), acertos de 2 ou 3 dezenas é mais do que es-
perado. Não tenho como fazer um estudo completo agora, mas creio que
seja mais provável você acertar 2 dezenas que nenhuma.
Para validar o seu estudo, é _necessário_ que você crie um 'grupo de
controle'. Proceda da seguinte maneira: toda semana, faça dois jogos.
Um deles deve conter os valores preditos pela sua rede neural; o ou-
tro deve conter valores gerados aleatoriamente. Você poderia criar
um outro grupo, apenas para comparação de resultados, por exemplo,
com números selecionados por uma pessoa qualquer -- um familiar ou
parente, mas sempre a mesma pessoa toda semana.
Para analisar os resultados, é necessário trabalhar com intervalos
de confiança e testes de hipótese. Se, nesses casos, você conseguir
encontrar uma diferença palpável, será possível dizer que os sorte-
ios são viciados ou que há alguma correlação temporal. Para aumen-
tar a confiabilidade dos seus testes, os experimentos devem ser re-
petidos diversas vezes -- pelo menos umas 30 semanas, para que a
amostra não seja pequena demais.
E poste os resultados aqui. :)
--
José Alexandre Nalon
na...@terra.com.br
Em Tuesday 25 November 2008 23:28:56 Thais Gobet escreveu:
> Algum de voces já fez algum estudo comparativo nessa área? Vi que,
> matematicamente, pode-se provar que ambas sao aproximadores de funçoes e
> que sempre existe uma rede MLP que se comporta como a RBF e vice-versa
> (teoricamente).
Estudos comparativos eu nunca vi. Matematicamente, é possível você
encontrar uma função de base radial semelhante à gaussiana a partir
do produto de duas sigmóides, então, de uma maneira bem genérica, um
neurônio com função de base radial pode ser aproximado por dois per-
céptrons. É lógico que existem detalhes em cada tipo de rede, mas em
princípios gerais, a aproximação é possível.
Mas, na minha parca experiência, o que eu noto é que com uma rede de
funções de base radial bem treinada, os resultados são expressivamen-
te melhores que com percéptrons. Nunca vi um estudo completo a esse
respeito, no entanto, e minha experiência pode ser exatamente com os
casos em que as RBFs são melhores que MLPs.
Em todo caso, não havendo um estudo a respeito, nada impede que se
faça um. :) Se isso for relevante para a decisão em alguma pesquisa
que você esteja desenvolvendo, esse estudo é certamente uma validação
a mais que pode ser feita dos seus resultados. Se houver interesse
seu, entre em contato em private comigo, porque certamente há inte-
resse meu, e creio que uma publicaçãozinha modesta pode ser feita com
esse comparativo. :)
Olá a todos,
O processo é estocastico, e portanto não há correlação temporal, e não se pode tratar a serie como uma série temporal. Mas estava pensando aqui, quando a rede converge de qualquer modo ela criou um modelo regressivo daqueles dados de treino, como se interpreta isso? talvez o padrao com que saia as senas sem correlação no tempo, ou seja, um modelo mais frequente de conjuntos de numeros que saem ? :S ... Independente do raciocinio estatistico da coisa, temos que considerar que de um ponto de vista deterministico, por mais que seja complexo o sistema de sorteio, independente se é viciado, ou se toma forma de tantos outros sistemas naturais, como o clima por exemplo, é um sistema, regido por váriaveis aleatorias, etc. E portanto pode ser modelado de alguma forma. E se as saidas destas senas tiverem correlação com as váriaveis, de forma a preservar informações suficientes sobre o sistema. Eu sou um determinista.
Ericson Sarmento2008/11/26 José Alexandre Nalon <na...@terra.com.br>
Olá,
Bom, se é um processo notadamente estocástico, e que não é a area de aplicação das redes neurais. Se é algo tao notadamente inutil, por que todos querem tanto a tal planilha??? será que é por causa do milhoes da mega?
afffffff... eu tbm quero ficar milionário.... :)
Ericson Sarmento2008/11/26 Maurício Vieira <maurici...@gmail.com>
Este email é longo e apenas para quem tem paciência para ler. Sorry! :)
Em Wednesday 26 November 2008 19:22:42 EliasGabriel escreveu:
> estou convencido
> que o conceito de "estocástico" precisa ser revisado, para mim o
> "caos" não é tão "caótico" quanto parece ser. Para mim o conceito de
> estocástico é apenas um termo que as pessoas utilizam para
> caracterizar um fenômeno que ainda não compreendem por "preguiça
> mental" ou por consecutivos fracassos em suas pesquisas, daí rotulam o
> fenômeno de "estocástico", não previsível.
Eu sou a primeira pessoa que vai defender a necessidade de investigar
todos os tipos de idéia, mesmo aquelas que parecem ir contra o que es-
tá estabelecido e o que parece sem solução. Mas acho que, antes de ten-
tar refutar uma teoria já bem estabelecida e com milhões e milhões de
experimentos comprobatórios (eg., quando você liga o computador ou fala
no seu celular), é necessário entendê-la muito bem antes. E, de qual-
quer forma, a teoria não fica invalidada, ela apenas fica com um campo
de ação restrito (pense na teoria da gravidade de Newton, que está er-
rada no geral, mas é usada até hoje para lançar satélites ao espaço).
Um processo estocástico [1] é um processo aleatório sobre uma ou mais
variáveis independentes (como tempo, espaço ou freqüência), e existe um
conjunto (gigantesco) de métodos de modelagem de sistemas onde existem
variáveis desconhecidas. Negar que existam grandezas desconhecidas é
meio complicado -- por exemplo, era impossível para todo mundo saber
que eu estaria enviando este email -- por diversos motivos: não é pos-
ível saber o que vai acontecer no futuro (*); é impossível modelar com
precisão um sistema; nenhum sistema é isolado de fato; alguns fenômenos
são inerentemente imprevisíveis. Portanto, o conceito de processo esto-
cástico _não_ precisa ser revisto. Quando muito, sua aplicação sobre um
ou outro experimento. Sugiro a referência [2] que, ainda que meio árido,
é um excelente livro sobre o assunto.
(*) Algumas pessoas se pronunciaram deterministas aqui na lista. Eu sou
'macroscopicamente-e-sob-as-condições-corretas' determinista, ou seja,
em um sistema macroscópico isolado onde todas as condições são conheci-
das e não haja interferências, é possível conhecer o estado futuro a
curto prazo com um erro pequeno. Mas fenômenos como os da física quân-
tica são realmente estocásticos e imprevisíveis -- e são os melhores
exemplos de predição em ciência que podemos encontrar. Os erros nas me-
dições da física quântica chegam a 1e-14%, ou seja, lá pela 16a. casa
decimal!
A teoria da probabilidade, sobre a qual a teoria de processos estocás-
ticos se baseia, é ainda mais antiga, mais comprovada e mais compreen-
dida. O sorteio da Megasena idealizado -- ou seja, sem vícios -- é pra
lá de conhecido (sob outras formas) e sua análise baseia-se na seguin-
te idéia: o sorteio em uma semana é independente do sorteio em outra
semana. Ou seja, não interessa quantas vezes um número saiu ou não sa-
iu em sorteios anteriores -- esse resultado não vai influenciar o sor-
teio desta semana.
É muito tentador pensar da seguinte forma: quais são as chances de um
determinado número _não_ sair durante semanas seguidas? Obviamente,
pequenas. Isso faz com que se acredite que as chances de um número
sair são maiores quanto mais tempo passa sem ele aparecer. Não é bem
isso que acontece. O exemplo a seguir é mais simples, mas o princí-
pio é o mesmo:
Imagine uma seqüência de 80 jogadas de uma moeda não viciada. Nas 79
primeiras jogadas, o resultado é cara. Ora, quais as chances de obter
80 caras em seguida? 2^(-80), o que é uma chance muito baixa. Portan-
to, o resultado da 80a. jogada _não_ vai ser cara!! Só que as chances
de você obter 79 caras e 1 coroa são exatamente as mesmas. É exatamen-
te a mesma coisa com o sorteio da Megasena: o número 42 não sai já há
42 semanas [3], portanto, ele _certamente_ vai aparecer logo em algum
sorteio, não? Infelizmente, isso não acontece. As chances dele apare-
cer ou não aparecer é independente do que aconteceu na semana anterior.
A abordagem por decomposição em dezenas e unidades e análise de fre-
qüência já é antiga e nunca deu certo, pelo mesmo motivo: o fato de uma
dezena não ter surgido há alguns sorteios não sigifnica que ela vai a-
parecer nos próximos sorteios.
Notem que não falei isso tudo como incentivo para que alguém abandone
sua pesquisa. Muito pelo contrário -- acho que as pesquisas devem con-
tinuar. Mas acho que é necessário compreender muito bem o que se está
pesquisando, para aprender a reconhecer os caminhos que devem ser to-
mados para que a investigação seja frutífera.
[1] http://en.wikipedia.org/wiki/Stochastic_process
[2] Papoulis & Pillai, "Probability, Random Variables and Stochastic
Processes".
[3] D. Adams, "The Hitchhiker's Guide to the Galaxy"
Exatamente, concordo com o Rafael e com o Nalon.
E como regra geral, lembrem-se que estocástico não significa
necessariamente aleatório. O processo de jogar uma moeda, por exemplo,
é estocástico, mas sequências geradas por este processo podem não ser
aleatórias, como: 1 1 1 1 1 1 1 (sendo 1: cara, 0: coroa). Esta
sequência é tão provável quanto: 01100111001 ou infinitas outras
(estou falando de aleatoriedade no sentido de Kolmogorov).
Eu sou a favor da pesquisa em QUALQUER campo, mesmo os mais
contraditórios (desde que siga o método científico). Eu mesmo, na
inocência da minha graduação, já tentei procurar um padrão pra
demonstrar a conjectura de Goldbach. Sabia que as chances de conseguir
alguma coisa eram desprezíveis e meus métodos não sofisticados (isto
tem a ver com auto-crítica).
O que me espantou aqui, desde o início, foi o método. Dois neurônios é
o menor número para uma topologia de rede capaz de resolver o XOR em
duas dimensões. Quem dirá fazer previsões de processos estocásticos?
[]'s
Cesar
2008/11/27 Rafael C.P. <kurama.youko.br@gmail.com>:
Voltando um pouco ao assunto principal da lista! :)
Em Thursday 27 November 2008 12:43:02 Cesar G. M. escreveu:
> O que me espantou aqui, desde o início, foi o método. Dois neurônios é
> o menor número para uma topologia de rede capaz de resolver o XOR em
> duas dimensões. Quem dirá fazer previsões de processos estocásticos?
Só pra constar, um único neurônio _pode_ fazer previsões em
processos estocásticos desde que a relação entre as amostras
seja assim representável. Veja o seguinte exemplo: suponha que
x[n] seja descrito pela equação:
x[n] = 0.5*x[n-1] + v[n]
em que x[n] é a amostra atual, x[n-1] a amostra anterior e v[n]
um processo estocástico gaussiano de média zero e variância um
(ruído branco gaussiano). Esse sinal pode ser predito por um
neurônio com uma única entrada, peso sináptico igual a 0.5 e a-
tivação linear -- exceto pelo ruído que é, por definição, inde-
pendente das amostras anteriores e portanto imprevisível. Pro-
cessos com dependências de maior prazo podem ser preditos por
neurônios com o número apropriado de entradas.
Esse é um processo auto-regressivo (AR). Na verdade, de uma for-
ma geral, qualquer processo auto-regressivo, de médias móveis
(MA - Moving Averages) ou ARMA (combinação dos dois) tem uma par-
te previsível que pode ser encontrada por um único neurônio li-
near adaptativo, e uma parte formada por uma combinação de ruí-
do branco. Esse é o teorema de Wold [1] -- infelizmente, a par-
te imprevisível é o grave problema. :)
Mas vale dizer: a relação encontrada é linear, o que raramente
é visto na realidade. Nesses casos, às vezes, aumentar o núme-
ro de entradas no neurônio ajuda, mas quase nunca resolve.
[1] Simon Haykin, "Adaptive Filter Theory". Eu _realmente_ re-
comendo os livros do Haykin pra qualquer um que esteja traba-
lhando em áreas que envolvam sinais, sistemas e sistemas adap-
tativos. Muitos dos livros dele já estão traduzidos para o por-
tuguês pela Bookman -- traduções excelentes, diga-se de passa-
gem. Este aqui, por enquanto, não está e acho que não vai ser
traduzido tão cedo -- a demanda pelo assunto desse livro é pe-
quena -- o que é uma pena.
Desenvolvi uma rede neural com 2 neuronios utilizando o SOLVER do
EXCEL. Estou utilizando a rede para fazer previsão da MEGASENA, estou
obtendo bons resultados, a rede aprende com base em todos os
resultados que são fornecidos pelo site da Caixa economica. Hoje estou
conseguindo jogar apenas um cartão com 6 dezenas e ter um acerto de 2
a 3 dezenas. A relação custo-benefício é excelente. Se alguém tiver
interesse em conhecer o processo para podermos aperfeiçoar o processo,
envie um e-mail para mim : eliasb...@gmail.com ou
eliasb...@hotmail.com