Defensa de Tesis de Maestria en Data Mining de Esteban Donato

14 views
Skip to first unread message

Daniel Vazquez V.

unread,
Dec 15, 2009, 7:47:17 PM12/15/09
to eea...@googlegroups.com
Hola a todos:

Tan solo por las dudas, ¿les llegó esto?

Es como para que estén enterados...

Les envío saludos.

Daniel Vazquez V.
Maestría DM&KDD-UBA


 

Invitamos a la defensa de la Tesis de Maestria del Especialista  en
Explotacion de datos y descubrimiento del Conocimiento
Ing. Esteban D. Donato el lunes 21 de Diciembre a las 15 hs en el
laboratorio 5 en Video Conferencia con Ottawa


Evaluating classification algorithms applied to data streams

Director: Dr. Fazel Famili ( Universidad Ottawa)
Co- Director: Dra. Ana S. Haedo
Jurados
Dr Marcelo Errecalde ( Universidad de San Luis)
Dr Richard Weber (Universidad de Chile)
Mg Maria Teresa Blaconá ( Universidad Nacional de Rosario)

Resumen
Actualmente la mayoría de las compañías y organizaciones recolectan y
mantienen gigantescas bases de datos que crecen en el orden de millones
de registros por día. En pocos meses se pueden recolectar más de mil
millones de registros y el histórico de registros puede llegar a los
cientos de miles de millones. Los algoritmos actuales (arboles de
decisión, conjunto de reglas) no pueden explotar ni siquiera una
fracción de estos datos en el tiempo necesario. Para resolver estos
problemas, debemos cambiar el enfoque tradicional de data mining por
sistemas que permitan explotar streams de datos continuos, frecuentes y
sin fin a medida que estos llegan. Estos algoritmos actualizan un modelo
continuamente, incorporando nuevos datos a medida que estos llegan. Un
problema importante que se relaciona con el aprendizaje de streams de
datos es conocido con el nombre de concept drift. Esto sucede cuando la
distribución de datos subyacente cambia en el tiempo. Un Concept drift
puede depender de cierto contexto oculto que no fue dado explícitamente
como atributo de predicción.
El objetivo de esta tesis se basa en el desarrollo de un análisis
comparativo entre varios algoritmos conocidos utilizados para streams de
datos. Los algoritmos que elegimos son: UFFT, CVFDT y VFDTc. El análisis
estará focalizado en algunos aspectos que todos los algoritmos aplicados
a streams de datos deben cumplir.
Palabras claves: aprendizaje incremental, streams de datos, concept
drift, aprendizaje en línea, explotación de datos, análisis comparativo


Ana S. Haedo


_______________________________________________
Docentes mailing list
Doce...@dc.uba.ar
https://listas.dc.uba.ar/cgi-bin/mailman/listinfo/docentes



PalermoNoEsHollywood

unread,
Dec 16, 2009, 6:46:10 AM12/16/09
to Enfoque Estadístico del Aprendizaje
Se puede ver por Internet? o se va a grabar?
saludos,
> > Docen...@dc.uba.ar
> >https://listas.dc.uba.ar/cgi-bin/mailman/listinfo/docentes- Ocultar texto de la cita -
>
> - Mostrar texto de la cita -
Reply all
Reply to author
Forward
0 new messages