Ajuda...

5 views
Skip to first unread message

anacoe...@gmail.com

unread,
May 7, 2008, 3:00:30 PM5/7/08
to Aprendizagem Computacional na UA
Boa tarde a todos.

Temos andado de volta do nosso trabalho e deparámo-nos com umas
dúvidas.

Para quem não sabe o trabalho vai ser construído de raiz uma vez que
vamos trabalhar com uma nova base de dados (real) com informação
proveniente do hospital onde trabalho.

A base de dados é constituída por 3 colunas, a primeira é o número do
processo do doente (NUM – é o nosso id), a segunda coluna corresponde
ao código de procedimento (COD_P) e a terceira ao código de
diagnóstico (COD_D).

Teremos como base todas as intervenções das especialidades de Cirurgia
e Ortopedia realizadas durante o ano de 2007 (são 6669 no total). Cada
intervenção realizada tem um código de diagnóstico e um código de
procedimento associado (exemplo: para o doente com o processo número
36699 temos o código de procedimento 8050 (Excisão ou destruição de
disco invertebral) e o código de diagnóstico 72290 (Transtornos discos
invertebrais NCOP ou SOE – região não especificada). Estes códigos são
atribuídos para cada intervenção por médicos codificadores usando o
livro ICD-9.

Como é de esperar existem doentes que foram intervencionados mais do
que uma vez durante o ano passado. E por essa razão vamos ter de
“agrupar” os códigos de procedimentos e de diagnósticos da seguinte
maneira:

NUM COD_P COD_D
40876 8605 82320
40876 8026 717
40876 4576 1533

Para o doente com o processo 40876 teríamos de ter um itemset do
género {8605; 8026; 82320; 717; 4576; 1533}. Num exemplo de
supermercado seria {batatas; arroz; vinho; leite; fraldas; sumo} e
depois consoante as compras de todos os clientes do supermercado (no
nosso caso doentes do hospital) teremos de criar os itemsets mais
frequentes e depois as tão desejadas regras de associação.

Pretendemos juntar os diagnósticos e os procedimentos de uma forma
tipo carrinho de compras e após termos procurado bastante no
RapidMiner não encontrámos nenhum operador que nos fizesse esse pré-
processamento.

Precisamos deste pré-processamento que nos dê os dados de maneira a
conseguirmos extrair de lá os itemsets frequentes com o operador
FPGrowth para depois finalmente calcular as regras de associação com o
operador que nos dá as regras de associação usando o algoritmo
Apriori.

Conseguem ajudar-nos a descobrir como fazer este pré-processamento no
Rapid Miner?

Obrigada, Raquel e Vitor Hugo

Gladys Castillo

unread,
May 8, 2008, 6:21:12 PM5/8/08
to Aprendizagem Computacional na UA
Boa noite:

Ainda não teve tempo de processar tudo istol. Já estudaram o tutorial:
12_AssociationRules.xml?

"This experiment uses two important preprocessing operators: First the
frequency discretization operator, which discretizes numerical
attributes by putting the values into bins of equal size. Second, the
filter operator nominal to binominal creates for each possible nominal
value of a polynominal attribute a new binominal (binary) feature
which is true if the example had the particular nominal value. These
preprocessing operators are necessary since particular learning
schemes can not handle attributes of certain value types. For example,
the very efficient frequent item set mining operator FPGrowth used in
this process setup can only handle binominal features and no numerical
or polynominal ones. The next operator is the frequent item set mining
operator FPGrowth. This operator efficiently calculates attribute
value sets often occuring together. From these so called frequent item
sets the most confident rules are calculated. with the association
rule generator. The result will be displayed in a rule browser where
desired conclusion can be selected in a selection list on the left
side. As for all other tables available in RapidMiner you can sort the
columns by clicking on the column header"

Pois para começar a perceber como usar os operador FPGrowth em
RapidMinner acho que devem tratar de perceber 100% este exemplo e
passo a passo analisar como os dados vão se transformando.

Cps,
Gladys

anacoe...@gmail.com

unread,
May 27, 2008, 2:35:59 PM5/27/08
to Aprendizagem Computacional na UA
Caros colegas, estamos a submeter o nosso relatorio ainda numa versao
provisoria na parte dos ficheiros.
Gostariamos que lessem e caso achem que é preciso modificar alguma
coisa (erro de português ou outro qualquer) avizem.
Agradecemos.

Ana Raquel e Vitor Hugo
Reply all
Reply to author
Forward
0 new messages