对社交网络的分析产品

0 views
Skip to first unread message

Qing

unread,
Nov 12, 2008, 12:50:01 AM11/12/08
to tt...@googlegroups.com
bin跟我是同事,他是我们这里的挖掘大师,一肚子都是算法之类的东西。挺值钱的,出去培训,一天两万。他的话不多,给人的印象总是如此。所以,有其他同事看到他在ttnn上的帖子,觉得这不像平时的他。我说,他是闷骚型的。

有一天,还是上个月的时候了,晚上,我下了班回去换了身衣服准备去吃饭。现在冷了,那时候还不冷呢,所以穿着短裤拖鞋就出门了,夹了本书,准备吃饭的时候看。我就住在上班的附近,晚上的时间很充裕,可以慢慢吃饭。点完了菜,闷头看书,还记得那本书叫做《我为什么拉皮条》,奥威尔的,准备学习学习经验。刚没几页,有人拍我肩膀,抬头,是bin。已经七点了,怎么才回去?他说,避开高峰期。

他不是很能聊天的那种,我也不算。但总不能大家不言不语吃饭吧,多不好意思。相对他,我要能扯些。所以,由我来挑选话题。

很久以前,他突然发了一封邮件给我,是他正在研究的一个东西,问我有没有兴趣找一些应用点。那是一个社交网络的东西,他给了一份ppt,老实说,我真看不明白。后来一次在地铁上碰到他,跟他说过一次,还是不明白。我不想去了解其中的细节,只是想知道他的输入输出,也就是边界是什么。可他总是说,这是个底层的东西。接着下车了,后来好长时间,我都没有关注这玩意儿。

这次晚饭相遇,于是又挑起这个话题。虽然这不是一个吃饭时候讨论的话题,后来惹得他不停地捣鼓碗里的面,但好歹还算一个大家都有点兴趣的话题。

我原来的设想,是他研究出来一个针对社交网络型数据的分析方案。这种表述还是我现在想到的,当时我并不是这样说。我问,输入输出是什么。他说,输入是变量,输出跟那些预测模型是一样的啊。这个回答等于没有回答,对于我来说,这也就是说,输入输出跟预测模型都是一样的,他们有什么区别呢?我希望他能够用一些再偏向应用层面的术语来描述输入输出,而不是用"变量"这种挖掘的词汇。可是他总是跟我说变量。

我们两个像傻逼一样,他很傻逼,我也傻逼。我已经吃完了,他还没吃完,我有个特点,就是可以一边吃饭一边讲话,他不行。可我们总是用自己的语言去表达,我反复地问到底这个模块的边界是什么,他反复地跟我强调,是变量。我有点崩溃,停了下来,让他吃点面,可能他也有点崩溃吧。

后来我终于明白了点,也许我们说的并不是一个东西,我抱着我原来的预期,认为这应当是一种模块化的东西,而对他来说,他研究了一种类似算法的东西。但我不能确定,一直到后来仍然是不清楚。也许等下次,如果我们在厕所相遇的时候,可以将这事情探讨清楚。每次探讨这个问题,都是在办公室之外的。这次要是再探讨下去,那个面馆都得下班了。

不过对于社交网络的分析,我认为是值得出来一种模块化,甚至产品化的分析功能。因为,社交网络的信息表达方式是类似的,无论是移动通讯,短信、qq、msn、mail或者是社交网站,他们的信息都可以抽象成如下:一方、另一方、通讯时间、还有内容。当然,有些内容暂时是无法捕捉的,比如移动通话的内容,而想msn这类的,可以捕捉内容。除此之外,每种不同类型的通讯网络,还有一些附属属性,比如移动通讯,还有通讯地点信息。不过至少是有共同点的。

没有必要非得把信息看成是"变量",可以再抽象一层啊。这就是输入。而输出,应当可以用一套术语集合来表达这种特定的分析,比如对于社交网络,希望能够从输入的信息中得到:
1、圈子(由若干方构成,圈子的类型,如工作、家庭);
2、关系(一方跟另一方的关系,甲方跟乙方,情侣关系..);
3、交际地位(是不是通讯网络的中心,是集中中心,还是发散中心);

通过上面共同基本信息,可以得到上面的输出,而针对附属属性的分析,还可以得到其他的信息,比如通过通讯地点,可以分析一个人的活动范围和轨迹。如果能够有这样的输出,倒是很容易应用。

这些也是后来想到的,而当时,我也说不清楚。写出来要比说出来清楚点,如果bin看到,也请说说。

raullew

unread,
Nov 12, 2008, 1:20:03 AM11/12/08
to ttnn BI 观点
我觉得吧
这并不需要解读,就像我们用google,搜索质量不错,那就行了,并不需要分析第一页的10个词条反映了啥
然而分析的过程是包含在开发过程之中的,即,分析不是目的,而成为算法设计和开发的辅助

On 11月12日, 下午1时50分, Qing <happys...@gmail.com> wrote:
> bin跟我是同事,他是我们这里的挖掘大师,一肚子都是算法之类的东西。挺值钱的,出去培训,一天两万。他的话不多,给人的印象总是如此。所以,有其他同事看到-他在ttnn上的帖子,觉得这不像平时的他。我说,他是闷骚型的。
>
> 有一天,还是上个月的时候了,晚上,我下了班回去换了身衣服准备去吃饭。现在冷了,那时候还不冷呢,所以穿着短裤拖鞋就出门了,夹了本书,准备吃饭的时候看。我-就住在上班的附近,晚上的时间很充裕,可以慢慢吃饭。点完了菜,闷头看书,还记得那本书叫做《我为什么拉皮条》,奥威尔的,准备学习学习经验。刚没几页,有人拍-我肩膀,抬头,是bin。已经七点了,怎么才回去?他说,避开高峰期。
>
> 他不是很能聊天的那种,我也不算。但总不能大家不言不语吃饭吧,多不好意思。相对他,我要能扯些。所以,由我来挑选话题。
>
> 很久以前,他突然发了一封邮件给我,是他正在研究的一个东西,问我有没有兴趣找一些应用点。那是一个社交网络的东西,他给了一份ppt,老实说,我真看不明白。-后来一次在地铁上碰到他,跟他说过一次,还是不明白。我不想去了解其中的细节,只是想知道他的输入输出,也就是边界是什么。可他总是说,这是个底层的东西。接着-下车了,后来好长时间,我都没有关注这玩意儿。
>
> 这次晚饭相遇,于是又挑起这个话题。虽然这不是一个吃饭时候讨论的话题,后来惹得他不停地捣鼓碗里的面,但好歹还算一个大家都有点兴趣的话题。
>
> 我原来的设想,是他研究出来一个针对社交网络型数据的分析方案。这种表述还是我现在想到的,当时我并不是这样说。我问,输入输出是什么。他说,输入是变量,输出-跟那些预测模型是一样的啊。这个回答等于没有回答,对于我来说,这也就是说,输入输出跟预测模型都是一样的,他们有什么区别呢?我希望他能够用一些再偏向应用层-面的术语来描述输入输出,而不是用"变量"这种挖掘的词汇。可是他总是跟我说变量。
>
> 我们两个像傻逼一样,他很傻逼,我也傻逼。我已经吃完了,他还没吃完,我有个特点,就是可以一边吃饭一边讲话,他不行。可我们总是用自己的语言去表达,我反复地-问到底这个模块的边界是什么,他反复地跟我强调,是变量。我有点崩溃,停了下来,让他吃点面,可能他也有点崩溃吧。
>
> 后来我终于明白了点,也许我们说的并不是一个东西,我抱着我原来的预期,认为这应当是一种模块化的东西,而对他来说,他研究了一种类似算法的东西。但我不能确定-,一直到后来仍然是不清楚。也许等下次,如果我们在厕所相遇的时候,可以将这事情探讨清楚。每次探讨这个问题,都是在办公室之外的。这次要是再探讨下去,那个面-馆都得下班了。
>
> 不过对于社交网络的分析,我认为是值得出来一种模块化,甚至产品化的分析功能。因为,社交网络的信息表达方式是类似的,无论是移动通讯,短信、qq、msn、m-ail或者是社交网站,他们的信息都可以抽象成如下:一方、另一方、通讯时间、还有内容。当然,有些内容暂时是无法捕捉的,比如移动通话的内容,而想msn这类-的,可以捕捉内容。除此之外,每种不同类型的通讯网络,还有一些附属属性,比如移动通讯,还有通讯地点信息。不过至少是有共同点的。
>
> 没有必要非得把信息看成是"变量",可以再抽象一层啊。这就是输入。而输出,应当可以用一套术语集合来表达这种特定的分析,比如对于社交网络,希望能够从输入的-信息中得到:
> 1、圈子(由若干方构成,圈子的类型,如工作、家庭);
> 2、关系(一方跟另一方的关系,甲方跟乙方,情侣关系..);
> 3、交际地位(是不是通讯网络的中心,是集中中心,还是发散中心);
>
> 通过上面共同基本信息,可以得到上面的输出,而针对附属属性的分析,还可以得到其他的信息,比如通过通讯地点,可以分析一个人的活动范围和轨迹。如果能够有这样-的输出,倒是很容易应用。

LiAndy

unread,
Nov 12, 2008, 1:26:36 AM11/12/08
to tt...@googlegroups.com
哈哈..............和这样的人交流确实很郁闷,确实要点'内力'。
bin出来说【社交网络的分析】。
--
------Crazy in Silence. Silence in Crazy.------

George Zhang

unread,
Nov 12, 2008, 2:11:51 AM11/12/08
to tt...@googlegroups.com
是和scale free network 有关的东西吗
其实算法也可以用形象的语言表述出来嘛

2008/11/12 LiAndy <netcl...@gmail.com>



--
Best Regard
George Zhang

Hawking, Bin

unread,
Nov 12, 2008, 4:09:27 AM11/12/08
to ttnn BI 观点
搞错了吧。我没说什么输入是变量之类。如果要说输入,应该说输入的是Graph或者network。相对来说,其它分析,输入的是vector集(二维
表),而且是这些假设这些观测是独立同分布的。

而且,SNA也不是什么模块。这是一个小学科,这方面的书很多。里面包括围绕network的很多分析,面向不同的目的。如果要说“输出”,那也是很多
的种的。

我的基本点是针对业务的实际情况,用相应的技术去match。比如客户之间有相互影响的,就用Graph这种数据结构来表达这种结构。会图论的人应该不
难理解。当然具体运算起来,会有些algebraic graph theory之类的东西,难一点。但出发点是去实现业务的具体结构,不是为了技术而
技术,为了算法而算法。

至于沟通上的问题,那是有别的原因吧。我是很功利的,呵呵。

ding jianting

unread,
Nov 12, 2008, 4:14:28 AM11/12/08
to tt...@googlegroups.com
Qing VS Bin! Go On!

2008/11/12 Hawking, Bin <binha...@gmail.com>

--
________________________________________
中国开源客户关系管理系统: http://www.c3crm.com
-----------------------------------------------------------------------

LiAndy

unread,
Nov 12, 2008, 4:26:07 AM11/12/08
to tt...@googlegroups.com
是好东西,就应该多值钱,不是功利不功利的问题。

例如,microsoft的人立方社交网络,不就是你说这个?可问题是你做的到底会是什么样的呢?

Qing

unread,
Nov 12, 2008, 4:43:10 AM11/12/08
to tt...@googlegroups.com
嘿嘿,大家就看热闹吧。还有LiAndy,你可别挑拨我跟bin的关系啊。

我表达出来的是我的理解,输入、输出,可能不是你的说法。但有个观点看能不能达成一个共识。

如果描述一样东西,尽量先描述他的边界(我喜欢叫做输入输出),它的用途、用法,这样应该可以清楚一点。这样还有个好处,就是不会透露你正在研究的核心。

而这个边界、作用,我觉得还是最好能够用一些通俗的,把听众当作傻瓜一样对待地表述。所以,如果你说"如果要说输入,应该说输入的是Graph或者network。我想能不能将这两个词再通俗化一些。graph听起来应该就是记录了通讯信息的吧,但表现形式是什么样的呢,是否也是二维表呢?而二维表是一种更加底层的概念,因为二维表里面能够放任何的输入,而任何的输入就等于没有说输入。要表达输入,不光有形式上的,还有内容上的。

至于输出,有很多种,有哪些呢?我觉得既然研究这个问题,如果说"这方面的书很多",那么我们就可以什么都不必说了,因为现在我们说的在很多书上都有。

或者可以换个说法,不说输入输出,而是说应用场景,我们来寻找一个应用场景。看这个社交网络分析这个"黑盒子"是如何按步骤使用的,谁用它的。

2008/11/12 Hawking, Bin <binha...@gmail.com>
搞错了吧。我没说什么输入是变量之类。如果要说输入,应该说输入的是Graph或者network。相对来说,其它分析,输入的是vector集(二维表),而且是这些假设这些观测是独立同分布的。

而且,SNA也不是什么模块。这是一个小学科,这方面的书很多。里面包括围绕network的很多分析,面向不同的目的。如果要说"输出",那也是很多的种的。

我的基本点是针对业务的实际情况,用相应的技术去match。比如客户之间有相互影响的,就用Graph这种数据结构来表达这种结构。会图论的人应该不难理解。当然具体运算起来,会有些algebraic graph theory之类的东西,难一点。但出发点是去实现业务的具体结构,不是为了技术而技术,为了算法而算法。
。。。

sammy liao

unread,
Nov 12, 2008, 5:29:50 AM11/12/08
to tt...@googlegroups.com
让我看看,可以共享一些算法么?如果可以的话,我也比较喜欢研究这个东西。

算法是个好东西啊。
 
Sammy
2008/11/12 Qing <happ...@gmail.com>

syfins

unread,
Nov 13, 2008, 10:31:22 AM11/13/08
to ttnn BI 观点
呵呵,SNA是俺们今年做的东西之一
简要介绍下:
算法方面没什么
抽象成图就可以了
圈子就是遍历寻找子图
这个对存储要求极高.......

具体的应用还是蛮广的
像交际地位,从离网预警来说,一个核心成员的流失会对这个群体带来毁灭性的打击,同样,推广新业务也是如此,重点突破,由点及面
大家有什么新的应用都可以交流:)


On 11月12日, 下午1时50分, Qing <happys...@gmail.com> wrote:
> bin跟我是同事,他是我们这里的挖掘大师,一肚子都是算法之类的东西。挺值钱的,出去培训,一天两万。他的话不多,给人的印象总是如此。所以,有其他同事看到-他在ttnn上的帖子,觉得这不像平时的他。我说,他是闷骚型的。
>
> 有一天,还是上个月的时候了,晚上,我下了班回去换了身衣服准备去吃饭。现在冷了,那时候还不冷呢,所以穿着短裤拖鞋就出门了,夹了本书,准备吃饭的时候看。我-就住在上班的附近,晚上的时间很充裕,可以慢慢吃饭。点完了菜,闷头看书,还记得那本书叫做《我为什么拉皮条》,奥威尔的,准备学习学习经验。刚没几页,有人拍-我肩膀,抬头,是bin。已经七点了,怎么才回去?他说,避开高峰期。
>
> 他不是很能聊天的那种,我也不算。但总不能大家不言不语吃饭吧,多不好意思。相对他,我要能扯些。所以,由我来挑选话题。
>
> 很久以前,他突然发了一封邮件给我,是他正在研究的一个东西,问我有没有兴趣找一些应用点。那是一个社交网络的东西,他给了一份ppt,老实说,我真看不明白。-后来一次在地铁上碰到他,跟他说过一次,还是不明白。我不想去了解其中的细节,只是想知道他的输入输出,也就是边界是什么。可他总是说,这是个底层的东西。接着-下车了,后来好长时间,我都没有关注这玩意儿。
>
> 这次晚饭相遇,于是又挑起这个话题。虽然这不是一个吃饭时候讨论的话题,后来惹得他不停地捣鼓碗里的面,但好歹还算一个大家都有点兴趣的话题。
>
> 我原来的设想,是他研究出来一个针对社交网络型数据的分析方案。这种表述还是我现在想到的,当时我并不是这样说。我问,输入输出是什么。他说,输入是变量,输出-跟那些预测模型是一样的啊。这个回答等于没有回答,对于我来说,这也就是说,输入输出跟预测模型都是一样的,他们有什么区别呢?我希望他能够用一些再偏向应用层-面的术语来描述输入输出,而不是用"变量"这种挖掘的词汇。可是他总是跟我说变量。
>
> 我们两个像傻逼一样,他很傻逼,我也傻逼。我已经吃完了,他还没吃完,我有个特点,就是可以一边吃饭一边讲话,他不行。可我们总是用自己的语言去表达,我反复地-问到底这个模块的边界是什么,他反复地跟我强调,是变量。我有点崩溃,停了下来,让他吃点面,可能他也有点崩溃吧。
>
> 后来我终于明白了点,也许我们说的并不是一个东西,我抱着我原来的预期,认为这应当是一种模块化的东西,而对他来说,他研究了一种类似算法的东西。但我不能确定-,一直到后来仍然是不清楚。也许等下次,如果我们在厕所相遇的时候,可以将这事情探讨清楚。每次探讨这个问题,都是在办公室之外的。这次要是再探讨下去,那个面-馆都得下班了。
>
> 不过对于社交网络的分析,我认为是值得出来一种模块化,甚至产品化的分析功能。因为,社交网络的信息表达方式是类似的,无论是移动通讯,短信、qq、msn、m-ail或者是社交网站,他们的信息都可以抽象成如下:一方、另一方、通讯时间、还有内容。当然,有些内容暂时是无法捕捉的,比如移动通话的内容,而想msn这类-的,可以捕捉内容。除此之外,每种不同类型的通讯网络,还有一些附属属性,比如移动通讯,还有通讯地点信息。不过至少是有共同点的。
>
> 没有必要非得把信息看成是"变量",可以再抽象一层啊。这就是输入。而输出,应当可以用一套术语集合来表达这种特定的分析,比如对于社交网络,希望能够从输入的-信息中得到:
> 1、圈子(由若干方构成,圈子的类型,如工作、家庭);
> 2、关系(一方跟另一方的关系,甲方跟乙方,情侣关系..);
> 3、交际地位(是不是通讯网络的中心,是集中中心,还是发散中心);
>
> 通过上面共同基本信息,可以得到上面的输出,而针对附属属性的分析,还可以得到其他的信息,比如通过通讯地点,可以分析一个人的活动范围和轨迹。如果能够有这样-的输出,倒是很容易应用。

Hawking, Bin

unread,
Dec 11, 2008, 10:47:12 PM12/11/08
to ttnn BI 观点
你们不会是在深圳吧?
内存才值多少钱呀
圈子那个试过"鬼魂聚类"没?


On Nov 13, 11:31 pm, syfins <syf...@gmail.com> wrote:
> 呵呵,SNA是俺们今年做的东西之一
> 简要介绍下:
> 算法方面没什么
> 抽象成图就可以了
> 圈子就是遍历寻找子图
> 这个对存储要求极高.......
>
> 具体的应用还是蛮广的
> 像交际地位,从离网预警来说,一个核心成员的流失会对这个群体带来毁灭性的打击,同样,推广新业务也是如此,重点突破,由点及面
> 大家有什么新的应用都可以交流:)
>
> On 11月12日, 下午1时50分, Qing <happys...@gmail.com> wrote:
>
>
>

> > bin跟我是同事,他是我们这里的挖掘大师,一肚子都是算法之类的东西。挺值钱的,出去培训,一天两万。他的话不多,给人的印象总是如此。所以,有其他同事看到--他在ttnn上的帖子,觉得这不像平时的他。我说,他是闷骚型的。
>
> > 有一天,还是上个月的时候了,晚上,我下了班回去换了身衣服准备去吃饭。现在冷了,那时候还不冷呢,所以穿着短裤拖鞋就出门了,夹了本书,准备吃饭的时候看。我--就住在上班的附近,晚上的时间很充裕,可以慢慢吃饭。点完了菜,闷头看书,还记得那本书叫做《我为什么拉皮条》,奥威尔的,准备学习学习经验。刚没几页,有人-拍-我肩膀,抬头,是bin。已经七点了,怎么才回去?他说,避开高峰期。


>
> > 他不是很能聊天的那种,我也不算。但总不能大家不言不语吃饭吧,多不好意思。相对他,我要能扯些。所以,由我来挑选话题。
>

> > 很久以前,他突然发了一封邮件给我,是他正在研究的一个东西,问我有没有兴趣找一些应用点。那是一个社交网络的东西,他给了一份ppt,老实说,我真看不明白。--后来一次在地铁上碰到他,跟他说过一次,还是不明白。我不想去了解其中的细节,只是想知道他的输入输出,也就是边界是什么。可他总是说,这是个底层的东西。接-着-下车了,后来好长时间,我都没有关注这玩意儿。


>
> > 这次晚饭相遇,于是又挑起这个话题。虽然这不是一个吃饭时候讨论的话题,后来惹得他不停地捣鼓碗里的面,但好歹还算一个大家都有点兴趣的话题。
>

> > 我原来的设想,是他研究出来一个针对社交网络型数据的分析方案。这种表述还是我现在想到的,当时我并不是这样说。我问,输入输出是什么。他说,输入是变量,输出--跟那些预测模型是一样的啊。这个回答等于没有回答,对于我来说,这也就是说,输入输出跟预测模型都是一样的,他们有什么区别呢?我希望他能够用一些再偏向应用-层-面的术语来描述输入输出,而不是用"变量"这种挖掘的词汇。可是他总是跟我说变量。
>
> > 我们两个像傻逼一样,他很傻逼,我也傻逼。我已经吃完了,他还没吃完,我有个特点,就是可以一边吃饭一边讲话,他不行。可我们总是用自己的语言去表达,我反复地--问到底这个模块的边界是什么,他反复地跟我强调,是变量。我有点崩溃,停了下来,让他吃点面,可能他也有点崩溃吧。
>
> > 后来我终于明白了点,也许我们说的并不是一个东西,我抱着我原来的预期,认为这应当是一种模块化的东西,而对他来说,他研究了一种类似算法的东西。但我不能确定--,一直到后来仍然是不清楚。也许等下次,如果我们在厕所相遇的时候,可以将这事情探讨清楚。每次探讨这个问题,都是在办公室之外的。这次要是再探讨下去,那个-面-馆都得下班了。
>
> > 不过对于社交网络的分析,我认为是值得出来一种模块化,甚至产品化的分析功能。因为,社交网络的信息表达方式是类似的,无论是移动通讯,短信、qq、msn、m--ail或者是社交网站,他们的信息都可以抽象成如下:一方、另一方、通讯时间、还有内容。当然,有些内容暂时是无法捕捉的,比如移动通话的内容,而想msn这-类-的,可以捕捉内容。除此之外,每种不同类型的通讯网络,还有一些附属属性,比如移动通讯,还有通讯地点信息。不过至少是有共同点的。
>
> > 没有必要非得把信息看成是"变量",可以再抽象一层啊。这就是输入。而输出,应当可以用一套术语集合来表达这种特定的分析,比如对于社交网络,希望能够从输入的--信息中得到:


> > 1、圈子(由若干方构成,圈子的类型,如工作、家庭);
> > 2、关系(一方跟另一方的关系,甲方跟乙方,情侣关系..);
> > 3、交际地位(是不是通讯网络的中心,是集中中心,还是发散中心);
>

> > 通过上面共同基本信息,可以得到上面的输出,而针对附属属性的分析,还可以得到其他的信息,比如通过通讯地点,可以分析一个人的活动范围和轨迹。如果能够有这样--的输出,倒是很容易应用。
>
> > 这些也是后来想到的,而当时,我也说不清楚。写出来要比说出来清楚点,如果bin看到,也请说说。- Hide quoted text -
>
> - Show quoted text -

syfins

unread,
Dec 12, 2008, 2:23:00 AM12/12/08
to ttnn BI 观点
鬼魂聚类?
介绍一下


On 12月12日, 上午11时47分, "Hawking, Bin" <binhawk...@gmail.com> wrote:
> 你们不会是在深圳吧?
> 内存才值多少钱呀
> 圈子那个试过"鬼魂聚类"没?
>
> On Nov 13, 11:31 pm, syfins <syf...@gmail.com> wrote:
>
>
>
> > 呵呵,SNA是俺们今年做的东西之一
> > 简要介绍下:
> > 算法方面没什么
> > 抽象成图就可以了
> > 圈子就是遍历寻找子图
> > 这个对存储要求极高.......
>
> > 具体的应用还是蛮广的
> > 像交际地位,从离网预警来说,一个核心成员的流失会对这个群体带来毁灭性的打击,同样,推广新业务也是如此,重点突破,由点及面
> > 大家有什么新的应用都可以交流:)
>
> > On 11月12日, 下午1时50分, Qing <happys...@gmail.com> wrote:
>

> > > bin跟我是同事,他是我们这里的挖掘大师,一肚子都是算法之类的东西。挺值钱的,出去培训,一天两万。他的话不多,给人的印象总是如此。所以,有其他同事看到---他在ttnn上的帖子,觉得这不像平时的他。我说,他是闷骚型的。
>
> > > 有一天,还是上个月的时候了,晚上,我下了班回去换了身衣服准备去吃饭。现在冷了,那时候还不冷呢,所以穿着短裤拖鞋就出门了,夹了本书,准备吃饭的时候看。我---就住在上班的附近,晚上的时间很充裕,可以慢慢吃饭。点完了菜,闷头看书,还记得那本书叫做《我为什么拉皮条》,奥威尔的,准备学习学习经验。刚没几页,有-人-拍-我肩膀,抬头,是bin。已经七点了,怎么才回去?他说,避开高峰期。


>
> > > 他不是很能聊天的那种,我也不算。但总不能大家不言不语吃饭吧,多不好意思。相对他,我要能扯些。所以,由我来挑选话题。
>

> > > 很久以前,他突然发了一封邮件给我,是他正在研究的一个东西,问我有没有兴趣找一些应用点。那是一个社交网络的东西,他给了一份ppt,老实说,我真看不明白。---后来一次在地铁上碰到他,跟他说过一次,还是不明白。我不想去了解其中的细节,只是想知道他的输入输出,也就是边界是什么。可他总是说,这是个底层的东西。-接-着-下车了,后来好长时间,我都没有关注这玩意儿。


>
> > > 这次晚饭相遇,于是又挑起这个话题。虽然这不是一个吃饭时候讨论的话题,后来惹得他不停地捣鼓碗里的面,但好歹还算一个大家都有点兴趣的话题。
>

> > > 我原来的设想,是他研究出来一个针对社交网络型数据的分析方案。这种表述还是我现在想到的,当时我并不是这样说。我问,输入输出是什么。他说,输入是变量,输出---跟那些预测模型是一样的啊。这个回答等于没有回答,对于我来说,这也就是说,输入输出跟预测模型都是一样的,他们有什么区别呢?我希望他能够用一些再偏向应-用-层-面的术语来描述输入输出,而不是用"变量"这种挖掘的词汇。可是他总是跟我说变量。
>
> > > 我们两个像傻逼一样,他很傻逼,我也傻逼。我已经吃完了,他还没吃完,我有个特点,就是可以一边吃饭一边讲话,他不行。可我们总是用自己的语言去表达,我反复地---问到底这个模块的边界是什么,他反复地跟我强调,是变量。我有点崩溃,停了下来,让他吃点面,可能他也有点崩溃吧。
>
> > > 后来我终于明白了点,也许我们说的并不是一个东西,我抱着我原来的预期,认为这应当是一种模块化的东西,而对他来说,他研究了一种类似算法的东西。但我不能确定---,一直到后来仍然是不清楚。也许等下次,如果我们在厕所相遇的时候,可以将这事情探讨清楚。每次探讨这个问题,都是在办公室之外的。这次要是再探讨下去,那-个-面-馆都得下班了。
>
> > > 不过对于社交网络的分析,我认为是值得出来一种模块化,甚至产品化的分析功能。因为,社交网络的信息表达方式是类似的,无论是移动通讯,短信、qq、msn、m---ail或者是社交网站,他们的信息都可以抽象成如下:一方、另一方、通讯时间、还有内容。当然,有些内容暂时是无法捕捉的,比如移动通话的内容,而想msn-这-类-的,可以捕捉内容。除此之外,每种不同类型的通讯网络,还有一些附属属性,比如移动通讯,还有通讯地点信息。不过至少是有共同点的。
>
> > > 没有必要非得把信息看成是"变量",可以再抽象一层啊。这就是输入。而输出,应当可以用一套术语集合来表达这种特定的分析,比如对于社交网络,希望能够从输入的---信息中得到:


> > > 1、圈子(由若干方构成,圈子的类型,如工作、家庭);
> > > 2、关系(一方跟另一方的关系,甲方跟乙方,情侣关系..);
> > > 3、交际地位(是不是通讯网络的中心,是集中中心,还是发散中心);
>

> > > 通过上面共同基本信息,可以得到上面的输出,而针对附属属性的分析,还可以得到其他的信息,比如通过通讯地点,可以分析一个人的活动范围和轨迹。如果能够有这样---的输出,倒是很容易应用。


>
> > > 这些也是后来想到的,而当时,我也说不清楚。写出来要比说出来清楚点,如果bin看到,也请说说。- Hide quoted text -
>

> > - Show quoted text -- 隐藏被引用文字 -
>
> - 显示引用的文字 -

Reply all
Reply to author
Forward
0 new messages