Davis,
Para mineria de datos recomiendo fuertemente
estadistica ya que no solo es aplicar los algoritmos ya construidos sobre un monton de datos, para entender su comportamiento incluso se trabaja con un equipo de matematicos, estadistas y de computacion. Ahora tienes la herramienta Weka que tiene ya implementado la mayoria de algoritmos muy usados o tambiein el lenguaje R, mas recomiendo fuertemente analizar cada algorimto en que se basa matematicamente ya que te permite entender los datos y como estan distribuidos. Tienes que tener muy claro la teoria detras de estas idieas:
Adjunto videos de mi profesor Estevam Kruskal y su orientador Tom Mitchell (de Carnegie Mellon, esta em portugues aunque da para entender) de tecnicas de aprendizaje de maquina
- ID3, C4.5, arboles de decision, weka
- Teoria de clasificadores bayesianos, frecuencia relativa, MAP, ML (Maximum Likelyhood), overfitting