特别赞赏张扬所讲:TAG是人性和情感表示。确实这是正变化中互联网的本性!
事实上,赞成一宁的插话:技术完全可以支持TAG分类,而不会导致混沌!这里,我也补充:
第一,TAG是有序,即便由于TAG会造成混沌,事实上,以物理世界的混沌分析已经揭示,某一混沌必然在某个时空中会有序(这是“熵”和“混沌理论”已经证实,普利高津(I.
Prigogine)为此获得诺贝尔奖;
第二,学科和对象差异必定采取不同分类方式和科学,图书有图书分类学,物品世界以产品编码(BAR
CODE
条形码,二维三维)和将来FRID的TAG,同样,作为社会计算必定是以带“人性和情感”色彩的TAG,也不同于基于关键词分类;事实上,原来搜索是基于分类科学和自然语言处理,对全文处理后结果,现在得考虑TAG本身是内含了“社会人”属性;
第三,技术上可实现的,不管是自然语言处理(NLP)还是基于分类的智能检索,都可以作为支持技术来实现对TAG的管理。一个简单统计原理,今天与会者是366,那么,至少有两人是同日生日!同样,技术上有数据仓库和数据挖掘,那也是基于海量数据的知识发现(如果庄秀丽看到此帖,可以请她讲讲知识管理KM)。而现在,是讲人的发现!
TAG讨论的另一个启迪是:BLOG,WIKI,SNS,等等是社会计算和社会网络(或如詹膑讲:社会交往)一个具体应用分支;人们正不知不觉地将社会属性(类似人情感等等)纳入到原来纯机器属性的计算科学和上一代互联网中,从而产生未来丰富关于人的互联网络!
这几天原本也在考虑TAG和其应用!仅供参考!
StanCHU
Mail:yife...@gmail.com
Blog:http://spaces.msn.com/members/stanchu/
我们已经拥有的技术手段可以支持这种"感性"吗?
中国除了blogger之外上千万网民可以真正区分tag和keyword和Categories之间的区别吗?
366个人至少有2个是同一个生日,那是因为一年只有365天,而当上千万人同时开始使用tag时,得到的就不仅仅是365这样的数量级了。
同意Categories和Tag同存互补的说法,但Tag仍然有很长的路要走!
Demi Zhu
mail: zhu...@gmail.com
Blog: http://blog.sharefm.net
msn: de...@the9.com
2005/11/6, yife...@gmail.com <yife...@gmail.com>:
--
Tks&Brdgs
Demi Zhu(朱彦奇)
MP:13501754948
Mail:zhu...@gmail.com
MSN:de...@the9.com
在 05-11-6,Demi Zhu<zhu...@gmail.com> 写道:
《关于Tags,背景解说和应用设想》
http://www.mulog.org/mulog/article.asp?id=607
我们在欣赏tag带来的人性化时,是否不要做的太盲目呢?
有些东西可以大力的发展tag,比如podcasting,但blog的entry应该如何使用tag呢?是不是所有的都需要呢?
昨天举的关于王建硕可能会给google base加上"信心"的tag。
但当一个与王建硕毫不相关的人,因为搜索"信心"这个tag而得到这则google base的消息时,是否会觉得莫名奇妙呢?
在 05-11-7,zhang yue<tagr...@gmail.com> 写道:
--
Tks&Brdgs
Demi Zhu
Mail:zhu...@gmail.com
MSN:de...@the9.com
Blog:http://blog.sharefm.net
我认为,担心"无序"的人并不是自由主义者,他们心里期望有一个独裁的英雄来帮助他们获得他们需要的内容和服务.
我支持可能"无序"也可能"有序"的tag应用.
再自由的社会也一定会有法律,同样自由的网络也一定需要有规则,即使"无序的规则"也是规则。
在 05-11-7,Zola<zuol...@gmail.com> 写道:
如果我有洞穿迷雾,预知未来的能力,我可以告诉大家这个规则将是什么。我既然没有这个超能力。那让我们在"无序的现状"中等待"有序的将来"吧。
我们可以做的是:让规则约定俗成,推广TAG,继续约定,继续俗成。
我坚信TAG能更方便f地帮助我们从海量的信息里"更快的"找到相关的内容,TAG并不能颠覆Categories(分类),Categories也能帮助我们更快的找到相关的内容.
事实上,这类似母TAG(Parent Tag)=>Catagories root tag, 子TAG(Sub-Tag)=>sub-tree
catagories.
另一方面,千万不要为TAG的繁多而导致混沌烦恼.相信一种有序是建立于看似无序上.
另一个问题,希望得以大家讨论, TAG加多少为佳(有人为20多个TAG而烦恼)?确实,
SNS的150原则,或页面的8秒原则,等等...那么,单一BLOG多少个TAG是最佳?
在 05-11-7,Zola<zuol...@gmail.com> 写道:
2005/11/7, 平生一笑 <thin...@gmail.com>:
> 修正一下,我也不认为Tag必须建立在Category之上,他们是在互补中相互促进,让这个世界更加易用。
>
--
前八卦帮常委
http://blog.we8log.com
一篇文章,通常是一个中心,两个基本点.所以我认为:root tag才是核心,其他的tag只是被简化的description.
如果一篇文章被加上150个tag,我相信这个人肯定不会坚持在将来原创的一百篇文章中都加上满满150个tag——如果他坚持了,我将猜测不出他的动机,我只好把他当成疯子——出现疯子的几率又是多少呢?
综上所述,"无序"的可能性很小,有了"一个中心,两个基本点"之后,"有序"的几率很大。
categories和tags之间的区别和联系我不说,没必要说。
在 05-11-7,猛禽<rapt...@gmail.com> 写道:
--
Best regards.
Zola
GTALK: zuol...@gmail.com
MSN: zola...@hotmail.com
BLOG: http://www.zuola.com/weblog/
在 05-11-7,Zola<zuol...@gmail.com> 写道:
--
前八卦帮常委
http://blog.we8log.com
SPAMer自身的困境是:在发送SPAM的成本很低的情况下,SPAM淹没在SPAM中.
加150个tags的可能性是存在的,我预计这种比率是很小的.我并不试图讨论如何让SPAM绝迹.
不过我还是觉得所有的Tags应该都是平等的,不应该有一些tags比另一些tags更平等。:P
在 05-11-7,Zola<zuol...@gmail.com> 写道:
--
前八卦帮常委
http://blog.we8log.com
〉一旦我搜索"信心"这个关键字并查看GOOGLE base的相关内容,我就会试图去理解王建硕给google base加上"信心"的tag的理由和动机.
我不认为一般的人不尝试去理解作者加上"信心"的动机,除非认识作者,或者这种理由和动机成为一种社会主流。互联网自出现以来一直是代表快速获得信息的途径,我想没有多少个人会为了解作者的动机,而浪费多于6秒的时间去阅读文章。当tag大量存在,本身就是一种网络垃圾。
〉让规则约定俗成,推广TAG,继续约定,继续俗成
赞成
2005/11/7, Demi <zhu...@gmail.com>:
> 似乎不平等的tag一定会出现的,我们看technorati,我们看Flickr,哪怕是Global
> Voice
> online,那大半个屏幕的tag里,总有大小,粗细的区别,这是一种实在的,需要的"不平等",我觉得从这点还是可以看出一点"有序"的!
>
--
前八卦帮常委
http://blog.we8log.com
http://episte.math.ntu.edu.tw/articles/mm/mm_13_3_01/
2005/11/8, encnen encnen <enc...@gmail.com>:
> 熵到底是什么?英文是什么?
>
简单化可以理解, 熵为混乱度或无序度. 总之,
"如果所讨论的对象不限于分子热运动,我们也可以借用熵的概念来描述并非分子热运动的其他任何物质运动方式、任何事物、任何系统的混乱度或无序度。"
查阅了一些网上资料汇总如下,仅供参考(比较专业,有兴趣继续读)
----------------------------------
熵与信息
经典热力学中关于熵的概念,最先是由克劳修斯提出来的。它的定义。即"热温商",作为热力学过程不可逆程度的一种量度。统计力学使我们对熵这个概念的实质有了更为深刻的理解。统计力学中对熵的定义是玻尔兹曼关系式。式中W是分子热运动状态的几率(热力学几率)。这样,熵便是分子随机热运动状态的几率大小的量度,也就是分子热运动的混乱程度或无序度。
如果所讨论的对象不限于分子热运动,我们也可以借用熵的概念来描述并非分子热运动的其他任何物质运动方式、任何事物、任何系统的混乱度或无序度。这样,我们就可以有另一种关于熵的概念,它是热力学和统计力学中熵概念的推广,可以叫做广义熵。广义熵也可以说是我们对事物运动状态的不肯定程度(不定度),这事实上就是信息论和控制论中关于熵的概念。这一概念几乎同时分别由费歇(R.A.Fisher)、维纳(N.Wiener)和申农(C.E.Shannon)从数学上表述出来。当我们得到足够的信息后所消除的关于事物运动状态的不肯定性程度,或者说所消除(或减少)的熵,可以叫做负熵,也就是信息量。信息量所表示的是体系的有序度、组织结构程度、复杂性、特异性或进化发展程度。这是熵(无序度、不定度、混乱度)的矛盾对立面,即负熵。
在文献中,熵和信息曾有过许多种不同单位或不同符号的表示法,但在概念上却只有两种。一种是热力学的熵,只能应用于分子或其他粒子的热运动这种特定的物质运动方式。它可由实验数据得出(经验物理熵),也可由分子运动的统计理论推演而得(理论物理熵);另一种是广义熵,它来自信息论和控制论,可应用于描述任何一种物质运动方式(包括生命现象)的混乱度或无序度,它的矛盾对立面叫负熵或信息量,是组织结构复杂程度或有序度的表示。广义熵概念的含义比热力学熵要广,对于热力学过程可还原为热力学的熵(通过单位换算)。但热力学的熵却并不能应用于非热力学过程,因为热力学熵的概念局限于粒子热运动这种特定的物质运动方式,它与能量(热量)的分配有特定的比例关系。对于并不涉及热能转换的非热力学过程,是不能应用的。可以说,热力学熵的概念是包含于广义熵之中的。
2005/11/8, Cheng Vista <iamv...@gmail.com>:
谢谢Chu Stan的答案。
通过tag把信息聚合起来也许能够帮助我们更好的组织信息
我来这个group就是想看我不懂的东西,见到不懂的东西,本能的反应就是发问。你可以说我笨,因为我的确不懂,但是你不能剥夺我发问的自由,因为天赋人权。
关于TAG,我有一点补充的,不论是category还是tag都是信息检索技术的一种,只是为了更方便地找到所需要的内容。当人们觉得category不够用时,就发明了tag。但我觉得tag的缺点也很明显:本来应该是同一个TAG的,但不同的人可能有不同的拼写,比如中文网志年会现在用的是cnbloggercon这是众所周知,但如果没有一个统一的宣传口径,则很可能出现一些如:cnblogcon,
cnbloggerconf, chnbloggercon...之类的,反而给信息聚合带来麻烦。
也许以后搜索技术的进步(智能化的提高)可能又会使tag变得不那么重要,但是不论是category、tag还是先进的搜索技术,也很难说哪一个会完全取代别的一个或两个,各有各的长处和用途,特别是category和tag都是由人确定,不是机器的搜索技术可以完全取代的。
在 05-11-11,Herock Xia<her...@gmail.com> 写道:
--
前八卦帮常委
http://blog.we8log.com
>而这个SESSION正在讨论的是TAG的话题,你的问题明显影响到别人对TAG的讨论。
对此我表示十分的歉意。但是我想讲一个故事(我明显是那种死不断气的人,希望大家不要介意,sorry^_^)最初电脑数据交换只是用于两台电脑交流数据之用的一种机制,后来在电脑名字前面加了个@和username,就变成了email,用于两个人之间的数据交换,当第一封用于私人通讯email发出,它就成了情感交流的工具,渐渐的email用于情感交流就成了世界上最浪漫的网恋,于是又就有了ICQ等等的IM。我想问的是,有谁说email、ICQ、网恋等等不是在数据交流这个概念之中的呢?由有谁来定义这个边界?我很抱歉我带错路,但是我尝试着冲破边界。我就是那么不安分的人。