{阅读} 机器学习与人工智能资源导引

已查看 962 次
跳至第一个未读帖子

pongba

未读,
2008年9月9日 04:22:352008/9/9
收件人 TopLanguage
人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索 这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),也是最近我关注得比较多的领域。

打算集这里的牛人们之力,整理一个资源导引,不仅包括经典书籍,还有期刊,名人,Website 等网络资源,整理完了建一个页面保存起来(供瞻仰:P ):-)

我先列几个吧,比较初级和经典的,肯定有许多遗漏,请大家补充:

书籍:
1. 入门好书《Programming Collective Intelligence》,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P
2. Peter Norvig 的 《AI, Modern Approach 2nd》(无争议的领域经典),上次讨论中 Shenli 使我开始看这本书了,建议有选择的看,部头还是太大了,比如我先看里面的概率推理部分的。
3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。
4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。
5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。
6. 《Managing Gigabytes》,信息检索经典。
7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。

相关数学基础(参考,不是拿来通读的):
《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。
《概率论及其应用》,威廉·费勒。也是极牛的书。
__ 哪位补充一本基本的线性代数的?
《Nonlinear Programming, 2nd》非线性规划的参考书。
《Convex Optimization》凸优化的参考书。

工具:
1. Weka (或知识发现大奖的数据挖掘开源工具集,非常华丽)

Wikipedia:
这个可以不用列了,直接去上面一搜,反正到处都是超链接。

牛人:
这个要列表里面的 Ph.D 大大们群策群力来完成了。

期刊:
同上。

P.S. 与认知科学交叉的一些资料请参考上次的一个帖子 。

--
刘未鹏(pongba)|C++的罗浮宫
http://blog.csdn.net/pongba
TopLanguage
http://groups.google.com/group/pongba

刘鎏

未读,
2008年9月9日 04:29:482008/9/9
收件人 pon...@googlegroups.com


2008/9/9 pongba <pon...@gmail.com>

人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索 这些无疑是 CS 领域最好玩的分支了(也是互相紧密联系的),也是最近我关注得比较多的领域。

打算集这里的牛人们之力,整理一个资源导引,不仅包括经典书籍,还有期刊,名人,Website 等网络资源,整理完了建一个页面保存起来(供瞻仰:P ):-)

我先列几个吧,比较初级和经典的,肯定有许多遗漏,请大家补充:

书籍:
1. 入门好书《Programming Collective Intelligence》,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P
2. Peter Norvig 的 《AI, Modern Approach 2nd》(无争议的领域经典),上次讨论中 Shenli 使我开始看这本书了,建议有选择的看,部头还是太大了,比如我先看里面的概率推理部分的。
3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。
4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。
5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。
6. 《Managing Gigabytes》,信息检索经典。
7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。

相关数学基础(参考,不是拿来通读的):
《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。
《概率论及其应用》,威廉·费勒。也是极牛的书。
__ 哪位补充一本基本的线性代数的?
《Nonlinear Programming, 2nd》非线性规划的参考书。
《Convex Optimization》凸优化的参考书。

工具:
1. Weka (或知识发现大奖的数据挖掘开源工具集,非常华丽)

Wikipedia:
这个可以不用列了,直接去上面一搜,反正到处都是超链接。

牛人:
这个要列表里面的 Ph.D 大大们群策群力来完成了。
     数据挖掘 周志华(国内)
                   Han jiawei (UIUC)

期刊:
   PAMI, IEEE tans

P.S. 与认知科学交叉的一些资料请参考上次的一个帖子 。

--
刘未鹏(pongba)|C++的罗浮宫
http://blog.csdn.net/pongba
TopLanguage
http://groups.google.com/group/pongba



--
Liu Liu
Ph.D Student
Department of  Systems Engineering
University of TianJin

Tel: 022 27408147
E-mail: liuli...@gmail.com
liu...@tju.edu.cn

Zoom.Quiet

未读,
2008年9月9日 04:35:182008/9/9
收件人 pon...@googlegroups.com
2008/9/9 pongba <pon...@gmail.com>:

> 人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索 这些无疑是 CS
> 领域最好玩的分支了(也是互相紧密联系的),也是最近我关注得比较多的领域。
> 打算集这里的牛人们之力,整理一个资源导引,不仅包括经典书籍,还有期刊,名人,Website 等网络资源,整理完了建一个页面保存起来(供瞻仰:P ):-)
>
> 我先列几个吧,比较初级和经典的,肯定有许多遗漏,请大家补充:
呃,老鹏的精力非常牛叉哪,,,,
这方面是俺垂涎久己,但是没有对应知识支持的领域了,,,
就玩过一会 Robocode ,,, 在这儿旁观先,,,

> 书籍:
> 1. 入门好书《Programming Collective Intelligence》,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P
> 2. Peter Norvig 的 《AI, Modern Approach 2nd》(无争议的领域经典),上次讨论中 Shenli
> 使我开始看这本书了,建议有选择的看,部头还是太大了,比如我先看里面的概率推理部分的。
> 3. 《The Elements of Statistical Learning》,数学性比较强,可以做参考了。
> 4. 《Foundations of Statistical Natural Language Processing》,自然语言处理领域公认经典。
> 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,相当深入浅出。
> 6. 《Managing Gigabytes》,信息检索经典。
> 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。
> 相关数学基础(参考,不是拿来通读的):
> 《矩阵分析》,Roger Horn。矩阵分析领域无争议的经典。
> 《概率论及其应用》,威廉·费勒。也是极牛的书。
> __ 哪位补充一本基本的线性代数的?
> 《Nonlinear Programming, 2nd》非线性规划的参考书。
> 《Convex Optimization》凸优化的参考书。
> 工具:

语言呢?
Prologo
Lisp
,,,

> 1. Weka (或知识发现大奖的数据挖掘开源工具集,非常华丽)
> Wikipedia:
> 这个可以不用列了,直接去上面一搜,反正到处都是超链接。
> 牛人:
> 这个要列表里面的 Ph.D 大大们群策群力来完成了。
> 期刊:
> 同上。
> P.S. 与认知科学交叉的一些资料请参考上次的一个帖子 。
> --
> 刘未鹏(pongba)|C++的罗浮宫
> http://blog.csdn.net/pongba
> TopLanguage
> http://groups.google.com/group/pongba
>


--

http://zoomquiet.org'''
过程改进乃是催生可促生靠谱的人的组织!
PE keeps evolving organizations which promoting people be good!'''

Du Lei

未读,
2008年9月9日 04:38:162008/9/9
收件人 pon...@googlegroups.com
机器学习这个方向,统计学也一样非常重要。推荐All of statistics,"这是CMU的一本很简洁的教科书 注重概念 简化计算 简化与Machine Learning无关的概念和统计内容,可以说是很好的快速入门材料。"

2008/9/9 pongba <pon...@gmail.com>

pongba

未读,
2008年9月9日 04:46:472008/9/9
收件人 pon...@googlegroups.com


2008/9/9 Zoom. Quiet <zoom....@gmail.com>

2008/9/9 pongba <pon...@gmail.com>:
> 人工智能、机器学习、自然语言处理、知识发现(特别地,数据挖掘)、信息检索 这些无疑是 CS
> 领域最好玩的分支了(也是互相紧密联系的),也是最近我关注得比较多的领域。
> 打算集这里的牛人们之力,整理一个资源导引,不仅包括经典书籍,还有期刊,名人,Website 等网络资源,整理完了建一个页面保存起来(供瞻仰:P ):-)
>
> 我先列几个吧,比较初级和经典的,肯定有许多遗漏,请大家补充:
呃,老鹏的精力非常牛叉哪,,,,

哈哈,看书当娱乐,自然是身体倍儿棒,吃饭倍儿香:P 

pongba

未读,
2008年9月9日 04:54:212008/9/9
收件人 TopLanguage
忘了补充人工智能的两本:

《Simple Heuristics that Makes Us Smart》(无电子版,有中文版)
《Bounded Rationality》(有电子版,见 gigapedia)

这两本都是德国ABC研究小组(一个由计算机科学家、认知科学家、神经科学家、经济学家、数学家、统计学家等组成的跨学科研究团体)集体写的,都是引起领域内广泛关注的书,尤其是前一本,後一本则是对 Herbert Simon (决策科学之父,诺奖获得者)提出的人类理性模型的扩充研究),可以说是把真正的什么是人类的智能这个问题提上了台面。核心思想是,我们的大脑根本不能做大量的统计计算,使用fancy的数学手法去解释和预测这个世界,而是通过简单而鲁棒的启发法来面对不确定的世界(比如第一本书中提到的两个非常著名的启发法:再认启发法(cognition heuristics)和选择最佳(Take the Best)。(当然,这并没有排斥统计方法就是了,数据量大的时候统计优势就出来了)

2008/9/9 pongba <pon...@gmail.com>

Wang SH.

未读,
2008年9月9日 04:58:342008/9/9
收件人 pon...@googlegroups.com

相关国际会议等级分类列表

AREA: Artificial Intelligence and Related Subjects

Rank 1:

AAAI: American Association for AI National Conference

IJCAI: International Joint Conference on AI

UAI: Conference on Uncertainty in AI

ICML: International Conference on Machine Learning

NIPS: Neural Information Processing Systems

Rank 2:

AID: International Conference on AI in Design

ECAI: European Conference on AI

IAAI: Innovative Applications in AI

ECML: European Conf on Machine Learning

ICNN/IJCNN: Intl (Joint) Conference on Neural Networks

ICPR: Intl Conf on Pattern Recognition

ICDAR: International Conference on Document Analysis and Recognition

CVPR:

 

Rank 3:

PRICAI: Pacific Rim Intl Conf on AI

AAI: Australian National Conf on AI

AI*IA: Congress of the Italian Assoc for AI

ANNIE: Artificial Neural Networks in Engineering

ANZIIS: Australian/NZ Conf on Intelligent Inf. Systems

CAIA: Conf on AI for Applications

CAAI: Canadian Artificial Intelligence Conference

ASADM: Chicago ASA Data Mining Conf: A Hard Look at DM

ICMS: International Conference on Multi-agent Systems

ASC: Intl Conf on AI and Soft Computing


AREA: Data Mining, KDD and Data Bases

Rank 1:

SIGKDD: ACM Special Interest Group Conf on Knowledge Discovery in Data and Data Mining

SIGMOD: ACM Special Interest Group Conf on Management Of Data

PODS: ACM SIGMOD Conf on Principles of DB Systems

VLDB: Very Large Data Bases

ICDE: Intl Conf on Data Engineering

ICDM: IEEE International Conference on Data Mining

Rank 2:

PKDD: Intl. Conf. on Principles and Practice of Knowledge Discovery in Database

PAKDD: Pacific-Asia Conf on Knowledge Discovery & Data Mining

SSD: Intl Symp on Large Spatial Databases

DEXA: Database and Expert System Applications

FODO: Intl Conf on Foundation on Data Organization

EDBT: Extending DB Technology

DOOD: Deductive and Object-Oriented Databases

DASFAA: Database Systems for Advanced Applications

CIKM: Intl. Conf on Information and Knowledge Management

SSDBM: Intl Conf on Scientific and Statistical DB Mgmt

Rank 3:

COMAD: Intl Conf on Management of Data

BNCOD: British National Conference on Databases

ADC: Australasian Database Conference

ADBIS: Symposium on Advances in DB and Information Systems

DaWaK - Data Warehousing and Knowledge Discovery

IDEAS - International Database Engineering and Application Symposium

 

Others:

NDB - National Database Conference (China)

KDDMBD - Knowledge Discovery and Data Mining in Biological Databases Meeting

IDC(W) - International Database Conference (HK CS)

WebDB - International Workshop on the Web and Databases

SBBD: Brazilian Symposium on Databases

W2GIS - International Workshop on Web and Wireless Geographical Information Systems

DOLAP - International Workshop on Data Warehousing and OLAP


2008/9/9 pongba <pon...@gmail.com>



--

pongba

未读,
2008年9月9日 04:59:312008/9/9
收件人 pon...@googlegroups.com
谢谢杜兄,正缺这么一本好的面向ML的统计学教材呢。费勒的《概率论及其应用》我真是看不下去啊。

王宁

未读,
2008年9月9日 08:11:182008/9/9
收件人 pon...@googlegroups.com
书:

Machine Learning, Tom Michell, 1997.
老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能"新"到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。

Modern Information Retrieval, Ricardo Baeza-Yates et al. 1999
老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo同学现在是Yahoo Research for Europe and Latin Ameria的头头。

Pattern Classification (2ed), Richard O. Duda, Peter E. Hart, David G. Stork
大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。

还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。

(呵呵,想起来一本:
Mining the Web - Discovering Knowledge from Hypertext Data

说一本名气很大的书
:Data Mining: Practical Machine Learning Tools and Techniques。Weka的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解Weka,看文档就好。第二版已经出了,没读过,不清楚。

人:

Tom Michell,前面说过了。他的主页上有很多Machine Learning的课程,可以看看。

Andrew Moore, 06年之前一直跟Tom Mitchell一起开课。主页上有很多写得非常不错的幻灯片,不过数学稍微多一点。

Jiawei Han,UIUC的大牛。我有几个同学跟过(着)他,在伊力诺依那个据说鸟不拉屎的地方灌水(SigKDD, ICML, etc)如麻。。。

Yiming Yang,CMU牛。有一篇综述入门必读。
A Comparative Study on Feature Selection in Text Categorization

周志华,就是牛人,不说了,自己去主页膜拜。小百合如果没关应该还能翻出这位同学当年读博灌水的帖子。

刊:

Machine Learning

International Conference on Machine Learning
European Conference on Machine Learning
SigKDD
WWW (今年在北京开,口号是One World, One Web,呵呵,应景)

就知道这么多了。其他等专业灌水的同志们补充吧。

文:

读得太少。眼下只能想到一片综述:
Text Categorization, Fabrizio Sebastiani, 2005
当然,顺便路过的就不用下了。毕竟是学术论文,虽然不难,也比论坛最有技术含量的帖子艰深十倍。

2008/9/9 pongba <pon...@gmail.com>

Du Lei

未读,
2008年9月9日 10:44:082008/9/9
收件人 pon...@googlegroups.com
信息检索方面的书现在建议看Stanford的那本Introduction to Information Retrieval,这书刚刚正式出版,内容当然up to date。

另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。据说是非常pratical的一本书。



2008/9/9 王宁 <nwan...@gmail.com>

Eric

未读,
2008年9月9日 11:56:402008/9/9
收件人 TopLanguage

其实这方面主要还是会议比较重要, 期刊一般就是跟进在会议后面的. 教科书也只是给个框架, 真正要做研究, 还得看会议论文集. 比较重要的会议上
面也列举了, 不过也不要迷信就是了, 有些不怎么样的会议也有好的研究成果.

南大周志华的研究主要是机器学习和数据挖掘. 这些的底子都是统计了. 纯 AI 现在做的人满少的, 而且大体走 search 和 CSP 的
路, 所以难度很高. 而数据挖掘和机器学习包括信息获取这些, 相对比较新, 比较火.

领域比较热, 所以牛人就比较多了, 列举不完的 :)

Du Lei

未读,
2008年9月9日 22:13:312008/9/9
收件人 pon...@googlegroups.com
对信息检索有兴趣的同学,强烈推荐翟成祥博士在北大的暑期学校课程,这里有全slides和阅读材料:
http://net.pku.edu.cn/~course/cs410/schedule.html

2008/9/9 pongba <pon...@gmail.com>

Wang SH.

未读,
2008年9月9日 22:19:462008/9/9
收件人 pon...@googlegroups.com
谢谢分享!

2008/9/10 Du Lei <dul...@gmail.com>



--

小马xioama

未读,
2008年9月10日 00:45:222008/9/10
收件人 pon...@googlegroups.com
补充一本基本的线性代数

(美)麦克莱恩(Mac Lane,S) / (美)伯克霍夫(Birkhoff,G.) / 2007-8-1 / 人民邮电出版社 / 69.0 / 平装

有中译本,近世代数概论 (美)G.伯克霍夫,(美)S.麦克莱恩著 王连祥,徐广善译 人民教育出版社,1980



2008/9/10 Wang SH. <shuai.w...@gmail.com>

maximzhao

未读,
2008年9月10日 02:17:012008/9/10
收件人 TopLanguage
加一本书:
Bishop
Pattern Recognition and Machine Learning. 没有影印的,但是网上能下到。经典中的经典。

pattern classification 和这本书是两本必读之书。Pattern Recognition and Machine
Learning是很新,深入浅出,手不释卷。

On 9月9日, 下午8时11分, "王宁" <nwang1...@gmail.com> wrote:
> 书:
>
> Machine Learning, Tom Michell,
> 1997.<http://www.amazon.com/Machine-Learning-Tom-M-Mitchell/dp/0070428077>
> 老书,牛人。现在看来内容并不算深,很多章节有点到为止的感觉,但是很适合新手(当然,不能"新"到连算法和概率都不知道)入门。比如决策树部分就很精彩,并且这几年没有特别大的进展,所以并不过时。另外,这本书算是对97年前数十年机器学习工作的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。
>
> Modern Information Retrieval, Ricardo Baeza-Yates et al.
> 1999<http://www.amazon.com/Modern-Information-Retrieval-Ricardo-Baeza-Yate...>
> 老书,牛人。貌似第一本完整讲述IR的书。可惜IR这些年进展迅猛,这本书略有些过时了。翻翻做参考还是不错的。另外,Ricardo<http://www.dcc.uchile.cl/%7Erbaeza/>同学现在是Yahoo
> Research for Europe and Latin Ameria的头头。
>
> Pattern Classification
> (2ed)<http://www.amazon.com/Pattern-Classification-2nd-Richard-Duda/dp/0471...>,
> Richard O. Duda<http://www.amazon.com/exec/obidos/search-handle-url?%5Fencoding=UTF8&...>,
> Peter E. Hart<http://www.amazon.com/exec/obidos/search-handle-url?%5Fencoding=UTF8&...>,
> David G. Stork<http://www.amazon.com/exec/obidos/search-handle-url?%5Fencoding=UTF8&...>
> 大约也是01年左右的大块头,有影印版,彩色。没读完,但如果想深入学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。
>
> 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,倒是讲到了了不少前沿和细节,诸如索引如何压缩之类。可惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。
>
> (呵呵,想起来一本:Mining the Web - Discovering Knowledge from Hypertext Data)
>
> 说一本名气很大的书:Data Mining: Practical Machine Learning Tools and
> Techniques。Weka的作者写的。可惜内容一般。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经不少,这一本应该可以不看了。如果要学习了解Weka,看文档就好。第二版已经出了,没读过,不清楚。
>
> 人:
>
> Tom Michell,前面说过了。他的主页上有很多Machine Learning的课程,可以看看。
>
> Andrew Moore <http://www.cs.cmu.edu/%7Eawm/>, 06年之前一直跟Tom
> Mitchell一起开课。主页上有很多写得非常不错的幻灯片,不过数学稍微多一点。
>
> Jiawei Han,UIUC的大牛。我有几个同学跟过(着)他,在伊力诺依那个据说鸟不拉屎的地方灌水(SigKDD, ICML, etc)如麻。。。
>
> Yiming Yang,CMU牛。有一篇综述入门必读。
> A Comparative Study on Feature Selection in Text
> Categorization<http://nyc.lti.cs.cmu.edu/yiming/Publications/icml97.ps>
>
> 周志华 <http://cs.nju.edu.cn/zhouzh/>
> ,就是牛人,不说了,自己去主页膜拜。小百合如果没关应该还能翻出这位同学当年读博灌水的帖子。
>
> 刊:
>
> Machine Learning <http://www.springerlink.com/content/100309/>
> International Conference on Machine Learning
> European Conference on Machine Learning
> SigKDD
> WWW <http://www2008.org/> (今年在北京开,口号是One World, One Web,呵呵,应景)
>
> 就知道这么多了。其他等专业灌水的同志们补充吧。
>
> 文:
>
> 读得太少。眼下只能想到一片综述:
> Text Categorization<http://nmis.isti.cnr.it/sebastiani/publications/tm05.pdf>,
> > P.S. 与认知科学交叉的一些资料请参考上次的一个帖子<http://groups.google.com/group/pongba/browse_frm/thread/93ac6f711122d2f/>
> > 。

pongba

未读,
2008年9月10日 02:40:112008/9/10
收件人 pon...@googlegroups.com


2008/9/10 maximzhao <zhaozh...@gmail.com>

加一本书:
Bishop
Pattern Recognition and Machine Learning. 没有影印的,但是网上能下到。经典中的经典。

Thanks,这本书的确非常赞。Bishop 本人也是领域大牛了。

pongba

未读,
2008年9月10日 03:02:492008/9/10
收件人 pon...@googlegroups.com


2008/9/10 pongba <pon...@gmail.com>



2008/9/10 maximzhao <zhaozh...@gmail.com>

加一本书:
Bishop
Pattern Recognition and Machine Learning. 没有影印的,但是网上能下到。经典中的经典。

Thanks,这本书的确非常赞。Bishop 本人也是领域大牛了。

追加一个链接吧:http://download.csdn.net/source/567343
清晰非OCR彩色版。
回复全部
回复作者
转发
0 个新帖子