专注是不断前进的指南针 --- 题记
基于Java的开源 Carrot2 搜索结果聚合聚类引擎
2.0发布了. Carrot2
可以自动的把自然的搜索结果归类(聚合聚类)到相应的语义类别中,这个功能是通过Carrot2一个现成的组件完成的,除此之外Carrot2
还包括了很多其他的搜索结果聚合聚类算法 search
results clustering algorithms 非常值得一看 . 今天10b lobster
和我聊起了新闻标题的平移算法,
如果这个算法被Carrot支持的话,应该是一个流行算法了。这个算法在卢亮的blog上曾经提到过。新闻阅读器也准备用这个算法进行新闻分类,提高新闻阅读速度。
Carrot2 2.0
的一个亮点是速度和易用性的提高。在易用性方面Carrot2提供了一个叫Aduna
ClusterMap
的可视化组,这个组件被放到了可以单独运行的GUI程序中了,详见:standalone
GUI application 。除此之外核心api也得到了简化,这里有
更多信息.
Carrot2 的流行还衍生了一家叫 Carrot Search
的公司,类似jboss ,mysql 相关的运营公司,
他们发布了发布了 Lingo3G ,可以想想出来了,Lingo3G (
这个名字真酷 lingo and 3g 呵呵 )--
提供高性能的文档聚合引擎
,这个引擎功能十分强进,他提供基于层级的,同义的
, 标签过滤的等功能。相比较 autonomy 还是有些差:
Autonomy
的技术内核,是一个被称为IDOL的智能信息处理层。IDOL由动态推理引擎
(DRE)、分类服务器、用户服务器等模块组成,DRE
可实现概念识别、自动摘要、有效识别、自动超链接、自然语言检索等核心操作,分类服务器可实现自动聚类、自动分类、自动目录生成等功能操作,用户服务器则可以实现个人化信息创建、个性化信息提示、个性化信息训练、专家定位等个性化操作。
http://blog.csdn.net/accesine960/archive/2006/09/25/1282935.aspx
http://www.carrot2.org/
http://project.carrot2.org/
http://www.theserverside.com/news/thread.tss?thread_id=42344
http://blog.csdn.net/accesine960/archive/2006/09/25/1282935.aspx