Preciso me confirmem se vão poder estar amanha pelas 13:30 na aula.
Ver neste tutorial on-line de PCA:
http://www.caip.rutgers.edu/riul/research/tutorials/tutorialrpca.pdf
os métodos que pode sem usados para tratar outliers (ver section 5). Na
secção 5.4 podem encontrar um dos métodos: o weighted Singular Value
Decomposition (SVD) technique, o qual está implementado em RapidMiner com o
operador Preprocessing.Attributes.Transformation.SVDReduction
Podiam comparar este operador com o PCA sem outliers.
Cps,
Gladys
>Estamos em volta da parte de avaliação mas não
>compreendemos bem como a fazer, principalmente com os operadores do
>rapidminer.O x-validation é só para classificação supervisada?
Amanha a essa hora não vou estar disponível. Podemos ao terminar as aulas da
próxima 6ª podemos falar um bocado ou senão marcamos outro dia para a
próxima semana. Mas para já queria orienta-las no seguinte:
1. Não podem usar nenhum esquema de validação para aprendizagem supervisada
de aqueles que foram usados ate agora.
2. Devem estudar com atenção a secção 8.5. de onde deverão resumir as
principais ideias sobre "cluster evaluation". Como podem constatar não
existem uma metodologia específica e a avaliação pode ser abordada consoante
o algoritmo usado. Por exemplo, podem ver que para o caso do k_Means é
sugerido usar a medida de SSE - sum of squared error (definida na página
373). Também, por exemplo, na pag. 401 são propostas umas medidas sobre
cohesion e separation (podiam explorar para ver se podem ser usadas), e na
pag. 406 explicam como validar usando a matrix de proximidade (ver Exemplo
8.10).
Por isso na sua parte de validação devem investigar primeiro quais são os
métodos usados em clustering. Uma vez identificados, tratem de ver se podem
descobrir se é possível ou não usá-los no RapidMiner
Cps,
Gladys