请尽快将本周五报告内容提要发到DMC公邮

2 views
Skip to first unread message

lilyyou_2008

unread,
Oct 24, 2012, 11:13:45 AM10/24/12
to joeg...@gmail.com, sail...@163.com, DMC
高涛,李赛:
      你们好!
      请尽快将本周五报告内容提要发到DMC公邮!
       因为我这没有次序安排,所以若本周五是其他组做报告,请相关组长尽快将本周五报告内容提要发到DMC公邮!
      谢谢!
祝好!
        尤丽


Tao Gao

unread,
Oct 24, 2012, 11:52:55 AM10/24/12
to lilyyou_2008, sail...@163.com, DMC
不好意思啊,我当时与我们组沟通,忘记给DMC抄送了。这下面是我们当时内容的安排和一些资料:

下周我们报告的内容分两块:一块是R的介绍,一块是图模型和R应用的介绍。

R的介绍下次由9个同学学习后报告,分为3各部分:R的基础介绍、R的绘图、R的数据分析过程(机器学习算法)。
  • R的基础介绍。此部分是四个同学完成:暴素菊、蒋秀文、霍剑、陈昱。学习完 https://www.coursera.org/course/compdata的前week2的内容,学习并整理做好笔记,向大家介绍包的安装、获取,基础的数据类型,经典的数据处理函数类型即可。选取的数据可以是ggplot2包中的mpg数据。(install.pakcages("ggplot2"); library(ggplot2); data(mpg))。
  • R的绘图介绍。此部分有两个同学完成:陈岷佳、李诗萌(不好意思,还有一位同学名字忘记了~看到了请给我发下邮件啊,真对不起)。主要是针对于上述这个数据用ggplot2这个软件包来多方面的展现数据。利用图形展示,主要讲清楚的问题是这个绘图过程是怎样的,不仅仅只是说用这个包就这样话,要讲清楚这个包作图的理念。具体请 http://docs.ggplot2.org/current/在线文档
  • R的数据分析过程(机器学习算法)。此部分有三个同学完成:陈弘、刘罡、陈森。主要是利用机器学习中的一些分类算法来解决一个问题. https://www.kaggle.com/c/titanic-gettingStarted,这里面用到的是随机森林算法来实现预测分类。 https://www.kaggle.com/wiki/RandomForests(多弄几个算法,比较下他们的分类错误率的高低)。另外其他分类算法可以参考附件:data-mining-with-r-by-sizhe-liu.pdf和 http://cos.name/wp-content/uploads/2011/11/ChinaR2011_SH_Nov12_05_szl.pdf 。需要完整的展示整个数据分析过程,从数据的观察、基本统计、图形展示、机器学习算法的评价和对比来讲讲整个数据分析的过程。这里有一个跟今天讲决策树相关的博文,感觉挺全还不错: http://blog.csdn.net/v_july_v/article/details/7577684。可以看看熟悉下。
 晓矛的内容包括:R中的图模型相关的package,另外一个是图模型的分析软件tetrad。
       形式是主要介绍算法思想,附带简单的软件示例
       钟昕昱:PC算法spirtes的,R包pcalg
       郭睿劼&李绪全:bnlearn包,好多好多算法,GS和IAMB是一定要介绍的,上下的hill climbing和各种大同小异的东西,可以选择一些介绍....
       王伟:R的图形实现,与图有关的各种包(其实好些我也不熟悉,你可能要自己多查一查),我这里列出一些~~igraph ,Rgraphviz ,gRbase ,dynamicGraph ,RBGL 
       相楠:tetrad,
       剩下图模型的基本定义和notation

祝好!



2012/10/24 lilyyou_2008 <lilyyo...@126.com>



--
--
Best Regards,
Tao Gao
--
Tao Gao<joeg...@gmail.com>
Homepage<http://www.gaotao.name>
School of Statistics,Renmin University of China

Gilbert Li

unread,
Oct 24, 2012, 8:24:27 PM10/24/12
to Tao Gao, lilyyou_2008, sail...@163.com, DMC
nice!

连我的也发了~

许婧雅会给大家讲图模型的基本定义、假设、notation~~O(∩_∩)O~
--
 
 


h.smart.911

unread,
Mar 28, 2013, 5:20:29 AM3/28/13
to DMC
大家好:
   附件是2013年3月29日~30日海峡两岸CATI与数据挖掘合作20周年暨第十届中国数据挖掘与商业智能研讨会的会议日程。
   请查收!  
 
 
 
 

h.smart.911 
会议日程_130328.doc
Reply all
Reply to author
Forward
0 new messages