Invitamos a la defensa de la Tesis de Maestria del Especialista en
Explotacion de datos y descubrimiento del Conocimiento
Ing. Esteban D. Donato el lunes 21 de Diciembre a las 15 hs en el
laboratorio 5 en Video Conferencia con Ottawa
Evaluating classification algorithms applied to data streams
Director: Dr. Fazel Famili ( Universidad Ottawa)
Co- Director: Dra. Ana S. Haedo
Jurados
Dr Marcelo Errecalde ( Universidad de San Luis)
Dr Richard Weber (Universidad de Chile)
Mg Maria Teresa Blaconá ( Universidad Nacional de Rosario)
Resumen
Actualmente la mayoría de las compañías y organizaciones recolectan y
mantienen gigantescas bases de datos que crecen en el orden de millones
de registros por día. En pocos meses se pueden recolectar más de mil
millones de registros y el histórico de registros puede llegar a los
cientos de miles de millones. Los algoritmos actuales (arboles de
decisión, conjunto de reglas) no pueden explotar ni siquiera una
fracción de estos datos en el tiempo necesario. Para resolver estos
problemas, debemos cambiar el enfoque tradicional de data mining por
sistemas que permitan explotar streams de datos continuos, frecuentes y
sin fin a medida que estos llegan. Estos algoritmos actualizan un modelo
continuamente, incorporando nuevos datos a medida que estos llegan. Un
problema importante que se relaciona con el aprendizaje de streams de
datos es conocido con el nombre de concept drift. Esto sucede cuando la
distribución de datos subyacente cambia en el tiempo. Un Concept drift
puede depender de cierto contexto oculto que no fue dado explícitamente
como atributo de predicción.
El objetivo de esta tesis se basa en el desarrollo de un análisis
comparativo entre varios algoritmos conocidos utilizados para streams de
datos. Los algoritmos que elegimos son: UFFT, CVFDT y VFDTc. El análisis
estará focalizado en algunos aspectos que todos los algoritmos aplicados
a streams de datos deben cumplir.
Palabras claves: aprendizaje incremental, streams de datos, concept
drift, aprendizaje en línea, explotación de datos, análisis comparativo
Ana S. Haedo
_______________________________________________
Docentes mailing list
Doce...@dc.uba.ar
https://listas.dc.uba.ar/cgi-bin/mailman/listinfo/docentes