也谈推荐系统

29 views
Skip to first unread message

Delin He

unread,
Apr 9, 2012, 12:37:33 AM4/9/12
to tt...@googlegroups.com

 

 

在当今互联网的时代,用户的确处在一个信息爆炸的时代,用户面对网络上的海量信息的扑面而来会迷失,所以在这种背景下推荐系统应运而生,它会根据用户的兴趣爱好推荐符合用户兴趣爱好的信息。无论用户在互联网的任何页面,推荐系统会将他所需要的信息主动推送到眼前。我们也可以说“互联网正从搜索时代进入推荐时代”。

所以各家也都开始在打造自己的推荐系统,尤其是电商及社交领域,AmazonNetflix、豆瓣、QQ等先行者由于自身迫切的推荐应用需求,这些先行者的推荐系统已经领先其它公司好几个身位。 很多人也看到了推荐系统将成为未来互联网里的一个重要元素,特别是各家社会化网站,将由推荐系统所驱动。

其实推荐系统的应用,也远远不再局限在电商 买了A,推荐B这些。在整个互联网中,推荐系统的应用可以说无处不在。

推荐引擎的门槛远远没有搜索引擎那么高,虽然推荐引擎的相关技术仍然只是掌握在为数不多的公司手中,市场上相关的人才也不是很多,但是互联网这个行业,只要有应用需求,技术永远都不是问题。当然一个优秀的推荐引擎的打造需要较长的时间,需要不断的IMPLEMENTATIONIMPROVEMENT,多种推荐算法的实现,算法输出的过滤排序、过度推荐控制、补足推荐控制机制等以及冷启动的处理控制都需要不断的去优化调整。 算法复杂度和算法精度的平衡,监控推荐效果根据用户动态修正模型,优化算法参数以及多个推荐算法混合的推荐机制,都需要耗费较多的精力。

 

下面来谈谈做推荐与传统行业BI的感受。

推荐系统必须依附于合适的应用体系或者平台之上,推荐本身无法作为一个单独的产品生存,推荐引擎需要很有的结合特定的应用场景,才会展现它的能量,脱离业务场景的推荐系统都是扯淡。 所以这点推荐系统和BI类似,没有他,业务也能开展,推荐的再好也只是锦上添花而已,从60%90%而已。

做推荐系统,与做传统行业BI 相比,它能实现我长久以来所期望的一种场景:一定程度的绕过缺乏数据化运营意识的所谓的业务需求方,打造和持续优化推荐引擎这一产品,直接介入运营。 推荐引擎的推荐内容可以直接触达到最终用户,推荐系统可以提升用户体验,带来可量化的转化率,产生最直接的价值。以前做传统行业BI如使用量低、业务依赖程度低等BI需求建设、应用的脱节等一系列问题在这可以一定程度的解决。

 

 --
Best regards!

He Delin(何德琳)
----------------------------------
Mailto: beij...@gmail.com

image001.jpg

langxian.chen

unread,
Apr 9, 2012, 1:01:48 AM4/9/12
to tt...@googlegroups.com
推荐大家一本书,个性化:商业的未来
http://product.dangdang.com/product.aspx?product_id=22593582
系统阐述了推荐技术在各个场景的应用

2012/4/9 Delin He <beij...@gmail.com>



--
陈浪仙
北京百分点信息科技有限公司
电话:+86-10-82484868、82484869 传真:+86-10-82484868
手机:13683248175 邮箱:langxi...@baifendian.com
MSN:vsha...@hotmail.com QQ:279036695

image001.jpg

xichen...@gmail.com

unread,
Apr 9, 2012, 4:34:26 AM4/9/12
to tt...@googlegroups.com
关于推荐,从一个使用者角度想到的:

场景1:假设我想入手一个二手kindle4,或者我住的附近有一个不错的游泳馆,我想入手一张还有使用次数的次卡。这个需求非常特定,网上的二手信息也很多,但是我肯定不想每天去刷一遍赶集网,所以赶集网上最好有一个界面让我输入想入手的东西(可以包括一些具体的价格范围、成色等属性),然后当有人发布符合的信息时自动推送给我。
场景2:Google的施密特讲过,在未来,假设你走在南京西路xx号,你的手机会提醒你,这里有家不错的川菜馆,且正有促销活动,或者提醒你你的不远处有家ZARA店正在打折。从后端的技术实现来说,首相应该是定位了你的位置,然后系统可能导入了你在大众点评网上的评价信息,分析出你喜欢川菜,而这家又口碑不错,甚者这家川菜馆就是你曾经给予好评的某家川菜馆的另一分店。对于ZARA的推荐,它可能是综合了各种渠道获得的促销信息和你的偏好而综合推荐的。

我觉得现在的推荐系统的最大问题是系统是隔离的,比如,我去当当买书,他主要是根据你以前的购买和别人的购买来推荐你可能买的书。但是在这个人人都被网住的时代,其实很我们在网上留下了很多的痕迹,我们可以把某人在网上留下的所有痕迹全部综合起来分析以对这个人有全方位的了解。

我设想的这样一个系统:在一个界面下,你首先可以输入尽可能多的关于你自己的信息。更关键的一点是可以导入所有你在网上留下的痕迹,说得简单点是一切二进制信息。比如可以输入你在点评网上用户名和密码,导入你在点评网上留下的所有记录。比如可以导入你的QQ聊天记录的信息。甚至本地文件系统上可以对你有更多的了解的信息。

在另一个界面,你就可以做第一个场景中的事情,你输入你想被推送信息的网站和相应网站上你想要获取的信息。或者这个系统会去抓取适合你的信息,或者你可以指定你优先关注的一些网站或分类。

当然这个系统还有另外一端,就是现在做得最多的,通过分析其他人的行为来预测你的行为。这个每家都积累了很多的信息,这些信息能综合起来再次分析就更好了,但是这应该是没有什么希望的。

Thanks & Best Regards




2012/4/9 langxian.chen <langxi...@baifendian.com>
image001.jpg

villa7.li

unread,
Apr 9, 2012, 4:44:56 AM4/9/12
to tt...@googlegroups.com
这个很有启发。很不错。
我们现在做的就是一个个性化推荐平台,目前还在更多的是类似电商的个性化推荐,你到网站上注册回答一些问题,就可以给你做推荐,推荐的内容可能不是很准确,你可以对商品评分、收藏、评论,你也可以上传新的商品,可以关注某些人,你发觉他们和你一样的品味。中长期我们希望做一个电商的推荐;更长期实际上就是个性化搜索了,输入你想要的就得到你想要的。当然app就会基于位置信息来做,就达到了你想要的第一种情景。

现在网站还在开发,网站叫   www.knowmi.cn  ,目前还没对外注册,想要注册的可以给我发邮件。bug还比较多,还在不断优化,也希望大家多多提好的建议。
image001.jpg

Q

unread,
Apr 9, 2012, 9:44:23 PM4/9/12
to tt...@googlegroups.com
谁看完了,总结一下吧。多谢!

On Mon, Apr 9, 2012 at 1:01 PM, langxian.chen <langxi...@baifendian.com> wrote:
推荐大家一本书,个性化:商业的未来
http://product.dangdang.com/product.aspx?product_id=22593582
系统阐述了推荐技术在各个场景的应用

...

Q

unread,
Apr 9, 2012, 10:04:39 PM4/9/12
to tt...@googlegroups.com
大家都去做推荐去了吗?为什么delin和villa原来搞电信,现在说起推荐也是一套一套的呢?

可不可以这么理解推荐系统:

研究用户想要什么。

当然,可以进一步说,是在什么地点,什么时候想要什么,以及,不想要什么。

那么,从那些方面可以得知一个人想要什么呢?有如下可能:
1、他以前、当前曾表露过感兴趣的东西,未来也感兴趣;
2、其身份决定他对某些东西感兴趣(比如女人对化妆品)
3、他给自己的潜在定位,会让他符合定位的东西感兴趣(比如大款对豪车,小资对宜家);
4、新出现的最热、最火的东西,对一个求新的人来说,有吸引力;
5、他周围人都在用的某种东西,对他很有影响力(或者排斥);
...

现在很多推荐系统似乎很关注你想要什么,而对你不想要什么不太在意。比如豆瓣的主页前段时间换了,就将推荐放在首页,结果满眼都是不太感兴趣的东西,只好回到旧版。当时我很奇怪,他们没有分析出来我不喜欢哪些东西吗?从我过去的使用历史其实可以显露出来,只是他们还没做到那一步罢。
ttnn
telno: 13514984944

image001.jpg

villa7.li

unread,
Apr 9, 2012, 10:26:12 PM4/9/12
to tt...@googlegroups.com
这本书有价值的就那么几页。大家可以都翻翻,我不打击了:)


villa7.li

unread,
Apr 9, 2012, 10:32:46 PM4/9/12
to tt...@googlegroups.com
推荐出现根本的原因是信息太多信息太泛滥,人越来越懒,找点自己想要的东西真不容易。如果推荐做好了是很牛的,但做不好就像你说的豆瓣,出来都是不想要的,反倒更崩溃。所以其实推荐不仅仅是算法推荐,有朋友推荐,所谓的专家推荐,热点推荐,基于位置推荐,不同时间的推荐,不同心情的推荐。

角度可以多一些,但多一些以后也同样更崩溃,所以真正牛的推荐最后就是集合了所有这些后就是真的是你想要的。但真做到这一点也很可怕,你的一举一动都有一双眼睛看着,知道你想要什么,潜在想要什么,比算命先生厉害的多,那是什么样的情景。。。。。。
image001.jpg

Delin He

unread,
Apr 9, 2012, 11:22:30 PM4/9/12
to tt...@googlegroups.com
俺现在做还做不到不想要什么。某一应用场景针对每个user的推荐Top N 列表,会记录推荐Top N 的展示,用户的点击日志等数据,这时可以分析用户的显性反馈和隐性的反馈,通过反馈如果用户对推荐Top N不感兴趣,Top N肯定需要及时调整,不感兴趣的直接干掉或者排到后面去,或者随展示时间的长长评分衰减。用户不感兴趣,记录下来,以后推荐滤掉。
在 2012年4月10日 上午10:04,Q <happ...@gmail.com>写道:
大家都去做推荐去了吗?为什么delin和villa原来搞电信,现在说起推荐也是一套一套的呢?

可不可以这么理解推荐系统:

研究用户想要什么。

当然,可以进一步说,是在什么地点,什么时候想要什么,以及,不想要什么。

那么,从那些方面可以得知一个人想要什么呢?有如下可能:
1、他以前、当前曾表露过感兴趣的东西,未来也感兴趣;
2、其身份决定他对某些东西感兴趣(比如女人对化妆品)
3、他给自己的潜在定位,会让他符合定位的东西感兴趣(比如大款对豪车,小资对宜家);
4、新出现的最热、最火的东西,对一个求新的人来说,有吸引力;
5、他周围人都在用的某种东西,对他很有影响力(或者排斥);
...

现在很多推荐系统似乎很关注你想要什么,而对你不想要什么不太在意。比如豆瓣的主页前段时间换了,就将推荐放在首页,结果满眼都是不太感兴趣的东西,只好回到旧版。当时我很奇怪,他们没有分析出来我不喜欢哪些东西吗?从我过去的使用历史其实可以显露出来,只是他们还没做到那一步罢。

Delin He

unread,
Apr 9, 2012, 11:38:10 PM4/9/12
to tt...@googlegroups.com
 淡定, 首先很感谢老张他们团队写本书,好歹也是个知识的普及。
 
 随着推荐应用需求的强烈,未来数年推荐技术也将是各家的标配,现在推荐技术正在处于“旧时王谢堂前
 
 燕,飞入寻常百姓家”的阶段,老张他们具备技术临时领先数年的优势 ,但是这也是他们团队未来的风、
 
 险,如果推荐技术已经飞入寻常百姓家了,他们的生存优势在哪, 所以也不能要求他们把这本书写的很
 
 有干货,毕竟他们写此书的目的是培育用户,打开自己的市场。
 
 
 
 
在 2012年4月10日 上午10:26,villa7.li <vill...@gmail.com>写道:
这本书有价值的就那么几页。大家可以都翻翻,我不打击了:)

在 2012年4月10日 上午9:44,Q <happ...@gmail.com>写道:
谁看完了,总结一下吧。多谢!

On Mon, Apr 9, 2012 at 1:01 PM, langxian.chen <langxi...@baifendian.com> wrote:
推荐大家一本书,个性化:商业的未来
http://product.dangdang.com/product.aspx?product_id=22593582
系统阐述了推荐技术在各个场景的应用

...

--

Q

unread,
Apr 9, 2012, 11:40:58 PM4/9/12
to tt...@googlegroups.com
老张是哪个,delin介绍一下推荐系统江湖格局吧,八卦一下...

Delin He

unread,
Apr 10, 2012, 12:08:15 AM4/10/12
to tt...@googlegroups.com

论坛里的张韶峰,百分点VP。 我觉得 现在的推荐标杆 Amazon、Netflix、豆瓣、Hulu、阿里系等。此外QQ基于关系链的 好友推荐产品 QQ圈子 ,我是赞不绝口。 要是漏了哪位神仙,麻烦冒个泡。
 

 
在 2012年4月10日 上午11:40,Q <happ...@gmail.com>写道:
老张是哪个,delin介绍一下推荐系统江湖格局吧,八卦一下...


On Tue, Apr 10, 2012 at 11:38 AM, Delin He <beij...@gmail.com> wrote:
 淡定, 首先很感谢老张他们团队写本书,好歹也是个知识的普及。
 
 随着推荐应用需求的强烈,未来数年推荐技术也将是各家的标配,现在推荐技术正在处于“旧时王谢堂前
 
 燕,飞入寻常百姓家”的阶段,老张他们具备技术临时领先数年的优势 ,但是这也是他们团队未来的风、
 
 险,如果推荐技术已经飞入寻常百姓家了,他们的生存优势在哪, 所以也不能要求他们把这本书写的很
 
 有干货,毕竟他们写此书的目的是培育用户,打开自己的市场。
 
 
 
 

villa7.li

unread,
Apr 10, 2012, 2:10:24 AM4/10/12
to tt...@googlegroups.com
原来是百分点的人写的,呵呵,怪不得,哪天德林“推荐”一下。


刘思喆

unread,
Apr 10, 2012, 11:20:18 PM4/10/12
to ttnn BI 观点
电信行业用推荐系统情景也很多啊,比如无线音乐歌曲推荐,数据产品推荐等

对于产品推荐一般的做法是根据用户行为计算产品偏好程度(潜在概率),可以简单的认为是"客户-产品";而另外一种就是推荐系统,根据产品和产品的关系
进行产品的直接推荐,可以描述为"产品-产品"。

推荐系统算法很多,比较有名的就是Item_based Collaborative Filtering,Amazon用的就是它。当然现在
Amazon后来又有很多优化,这水就深了~~

On 4月10日, 上午10时04分, Q <happys...@gmail.com> wrote:
> 大家都去做推荐去了吗?为什么delin和villa原来搞电信,现在说起推荐也是一套一套的呢?
>
> 可不可以这么理解推荐系统:
>
> 研究用户想要什么。
>
> 当然,可以进一步说,是在什么地点,什么时候想要什么,以及,不想要什么。
>
> 那么,从那些方面可以得知一个人想要什么呢?有如下可能:
> 1、他以前、当前曾表露过感兴趣的东西,未来也感兴趣;
> 2、其身份决定他对某些东西感兴趣(比如女人对化妆品)
> 3、他给自己的潜在定位,会让他符合定位的东西感兴趣(比如大款对豪车,小资对宜家);
> 4、新出现的最热、最火的东西,对一个求新的人来说,有吸引力;
> 5、他周围人都在用的某种东西,对他很有影响力(或者排斥);
> ...
>

> 现在很多推荐系统似乎很关注你想要什么,而对你*不想要*
> 什么不太在意。比如豆瓣的主页前段时间换了,就将推荐放在首页,结果满眼都是不太感兴趣的东西,只好回到旧版。当时我很奇怪,他们没有分析出来我不喜欢哪些东西 吗?从我过去的使用历史其实可以显露出来,只是他们还没做到那一步罢。


>
>
>
>
>
>
>
>
>
> On Mon, Apr 9, 2012 at 4:44 PM, villa7.li <villa7...@gmail.com> wrote:
> > 这个很有启发。很不错。
>

> > 我们现在做的就是一个个性化推荐平台,目前还在更多的是类似电商的个性化推荐,你到网站上注册回答一些问题,就可以给你做推荐,推荐的内容可能不是很准确,你可 以对商品评分、收藏、评论,你也可以上传新的商品,可以关注某些人,你发觉他们和你一样的品味。中长期我们希望做一个电商的推荐;更长期实际上就是个性化搜索了 ,输入你想要的就得到你想要的。当然app就会基于位置信息来做,就达到了你想要的第一种情景。


>
> > 现在网站还在开发,网站叫 www.knowmi.cn,目前还没对外注册,想要注册的可以给我发邮件。bug还比较多,还在不断优化,也希望大家多多提好的建议。
>

> > 在 2012年4月9日 下午4:34, <xichengmyl...@gmail.com>写道:
>
> > 关于推荐,从一个使用者角度想到的:
>
> >> 场景1:假设我想入手一个二手kindle4,或者我住的附近有一个不错的游泳馆,我想入手一张还有使用次数的次卡。这个需求非常特定,网上的二手信息也很多, 但是我肯定不想每天去刷一遍赶集网,所以赶集网上最好有一个界面让我输入想入手的东西(可以包括一些具体的价格范围、成色等属性),然后当有人发布符合的信息时 自动推送给我。
>

> >> 场景2:Google的施密特讲过,在未来,假设你走在南京西路xx号,你的手机会提醒你,这里有家不错的川菜馆,且正有促销活动,或者提醒你你的不远处有家Z ARA店正在打折。从后端的技术实现来说,首相应该是定位了你的位置,然后系统可能导入了你在大众点评网上的评价信息,分析出你喜欢川菜,而这家又口碑不错,甚 者这家川菜馆就是你曾经给予好评的某家川菜馆的另一分店。对于ZARA的推荐,它可能是综合了各种渠道获得的促销信息和你的偏好而综合推荐的。


>
> >> 我觉得现在的推荐系统的最大问题是系统是隔离的,比如,我去当当买书,他主要是根据你以前的购买和别人的购买来推荐你可能买的书。但是在这个人人都被网住的时代 ,其实很我们在网上留下了很多的痕迹,我们可以把某人在网上留下的所有痕迹全部综合起来分析以对这个人有全方位的了解。
>
> >> 我设想的这样一个系统:在一个界面下,你首先可以输入尽可能多的关于你自己的信息。更关键的一点是可以导入所有你在网上留下的痕迹,说得简单点是一切二进制信息 。比如可以输入你在点评网上用户名和密码,导入你在点评网上留下的所有记录。比如可以导入你的QQ聊天记录的信息。甚至本地文件系统上可以对你有更多的了解的信 息。
>
> >> 在另一个界面,你就可以做第一个场景中的事情,你输入你想被推送信息的网站和相应网站上你想要获取的信息。或者这个系统会去抓取适合你的信息,或者你可以指定你 优先关注的一些网站或分类。
>
> >> 当然这个系统还有另外一端,就是现在做得最多的,通过分析其他人的行为来预测你的行为。这个每家都积累了很多的信息,这些信息能综合起来再次分析就更好了,但是 这应该是没有什么希望的。
>
> >> Thanks & Best Regards
>

> >> 2012/4/9 langxian.chen <langxian.c...@baifendian.com>


>
> >> 推荐大家一本书,个性化:商业的未来
> >>>http://product.dangdang.com/product.aspx?product_id=22593582
> >>> 系统阐述了推荐技术在各个场景的应用
>

> >>> 2012/4/9 Delin He <beiji...@gmail.com>
>
> >>>> ** **
>
> >>>> 在当今互联网的时代,用户的确处在一个信息爆炸的时代,用户面对网络上的海量信息的扑面而来会迷失,所以在这种背景下推荐系统应运而生,它会根据用户的兴趣爱好 推荐符合用户兴趣爱好的信息。无论用户在互联网的任何页面,推荐系统会将他所需要的信息主动推送到眼前。我们也可以说"互联网正从搜索时代进入推荐时代"。
> >>>> ****


>
> >>>> 所以各家也都开始在打造自己的推荐系统,尤其是电商及社交领域,Amazon、Netflix、豆瓣、QQ等先行者由于自身迫切的推荐应用需求,这些先行者的推 荐系统已经领先其它公司好几个身位。

> >>>> 很多人也看到了推荐系统将成为未来互联网里的一个重要元素,特别是各家社会化网站,将由推荐系统所驱动。 ****
>
> >>>> 其实推荐系统的应用,也远远不再局限在电商 买了A,推荐B这些。在整个互联网中,推荐系统的应用可以说无处不在。****
>
> >>>> ****
>
> >>>> ****
>
> >>>> 推荐引擎的门槛远远没有搜索引擎那么高,虽然推荐引擎的相关技术仍然只是掌握在为数不多的公司手中,市场上相关的人才也不是很多,但是互联网这个行业,只要有应 用需求,技术永远都不是问题。当然一个优秀的推荐引擎的打造需要较长的时间,需要不断的
> >>>> IMPLEMENTATION和IMPROVEMENT,多种推荐算法的实现,算法输出的过滤排序、过度推荐控制、补足推荐控制机制等以及冷启动的处理控制都需 要不断的去优化调整。
> >>>> 算法复杂度和算法精度的平衡,监控推荐效果根据用户动态修正模型,优化算法参数以及多个推荐算法混合的推荐机制,都需要耗费较多的精力。****
>
> >>>> ** **
>
> >>>> 下面来谈谈做推荐与传统行业BI的感受。****
>
> >>>> 推荐系统必须依附于合适的应用体系或者平台之上,推荐本身无法作为一个单独的产品生存,推荐引擎需要很有的结合特定的应用场景,才会展现它的能量,脱离业务场景 的推荐系统都是扯淡。
> >>>> 所以这点推荐系统和BI类似,没有他,业务也能开展,推荐的再好也只是锦上添花而已,从60%到90%而已。****


>
> >>>> 做推荐系统,与做传统行业BI 相比,它能实现我长久以来所期望的一种场景:一定程度的绕过缺乏数据化运营意识的所谓的业务需求方,打造和持续优化推荐引擎这一产品,直接介入运营。
> >>>> 推荐引擎的推荐内容可以直接触达到最终用户,推荐系统可以提升用户体验,带来可量化的转化率,产生最直接的价值。以前做传统行业BI

> >>>> 如使用量低、业务依赖程度低等BI需求建设、应用的脱节等一系列问题在这可以一定程度的解决。****
>
> >>>> ** **
>
> >>>> ** --


> >>>> Best regards!
>
> >>>> He Delin(何德琳)
> >>>> ----------------------------------

> >>>> Mailto: beiji...@gmail.com
> >>>> **


>
> >>>> --
> >>>> 订阅地址:ttnn+su...@googlegroups.com
> >>>> 退订地址:ttnn+uns...@googlegroups.com
>
> >>> --
> >>> 陈浪仙
> >>> 北京百分点信息科技有限公司
> >>> 电话:+86-10-82484868、82484869 传真:+86-10-82484868

> >>> 手机:13683248175 邮箱:langxian.c...@baifendian.com
> >>> MSN:vshany...@hotmail.com QQ:279036695


>
> >>> --
> >>> 订阅地址:ttnn+su...@googlegroups.com
> >>> 退订地址:ttnn+uns...@googlegroups.com
>
> >> --
> >> 订阅地址:ttnn+su...@googlegroups.com
> >> 退订地址:ttnn+uns...@googlegroups.com
>
> > --
> > 订阅地址:ttnn+su...@googlegroups.com
> > 退订地址:ttnn+uns...@googlegroups.com
>
> --

> *ttnn*
> *telno: 13514984944*
>
> image001.jpg
> 54K查看下载

Message has been deleted

Barry_Tonghuabing

unread,
Apr 11, 2012, 7:31:28 AM4/11/12
to ttnn BI 观点
Delin那幅图总结的很经典啊,但缺少了邮件营销的场景啊,收下,谢谢!
Reply all
Reply to author
Forward
0 new messages