IUI2010 Recommendation Session 总结 20090208

11 views
Skip to first unread message

Yuan Quan

unread,
Feb 8, 2010, 4:34:26 AM2/8/10
to Resys

今天下午的recommendation session讲了3篇paper,凭记忆记下来的基本概念。如果大家要看原文,等些天在acm.org上就
应该可以下载了。 明天有两篇讲mobile上做推荐的paper,比较期待,完了再写个小结。昨天的social recommender
workshop的内容,随后补上 :)

1. Personalized News Recommendation based on Click Behavior
Peter来自goggle news的team,从事google news recommendation的工作。
以前的google news推荐用的事比较经典的CF方法,用lsh/minhash将用户分到若干bucket中,再进行推荐,粒度比较粗。
Peter他们现在提出的方法是,只用<user, timestamp, category>的数据,先为每个用户建立一个兴趣模型,在各个
category上的兴趣用向量来表示。当一个新的news story来的时候,先找到它所属的类,再用贝叶斯分类的思想来判断当前用户有多大概率喜
欢这个story。
根据新闻领域的特点,他们的model也考虑了local effect 和 global effect 对用户行为的影响,因为一个人在看新闻是很
容易受到别人的影响,尤其是有同样demographic信息的人。

最后做预测时,用这个简单公式来hybrid两种推荐: P = P_cf x P_topic x Constant
P_cf 来源于传统的CF推荐, P_topic就是前面的概率。

通过这个方法,虽然方法比较简单,也能提高 31% 的CTR。 还有个有意思的发现时,用户一次登录浏览的新闻条数是差不多不变的,推荐不能增加浏览
的总量,只是相当于从别的渠道“偷”了些浏览来。昨天和Peter聊了很久,他个人有点心得可以share,就是做推荐里面
understanding your data是最重要的,其次才是算法。这点和去年recommender system 09上 John
riedle的结论基本一致,后者还强调了一点,就是user interface和应用的紧密结合。

2. Aspect-level News Browsing: Understanding News Events from Multiple
Viewpoints
第二篇文章是来自韩国 kaist大学的,题目是 aspect-level news browsing
这个其实和个性化推荐联系不大。他们是基于一个事实,对同样的一个时间,不同媒体进行报导时都会参入自己的观点。比如布什当初访问韩国时挥拳这个动作,
不同国家的通讯社有不同的说法。他们做的是提出了一个aspect-level 新闻浏览的界面和机制,针对某个时间,向用户展示不同时间段,持各种观
点的新闻,让用户对事件有个全面的认识。不同aspect的新闻是通过聚类产生,自己提了个framing cycleaware
clustering (FCAC)的方法,利用了新闻的内容和结构信息。
nclab.kaist.ac.kr/papers/Conference/ALB.pdf

3. Personalized Reading Support for second-language web documents by
Collective Intelligence
日本东京大学, 当人们在阅读外语的文章时,猜测这篇文章中你可能有哪些单词不认识,然后在旁边提供自动翻译帮助。 他们给予IRT模型的简化版
Rasch model,用<Yi, Ui, Ti> 来表示用户Ui 对单词 Ti 的认识程度Yi(分5级)。他们先让若干用户对词进行标注(每个
用户pay 了300 $USD,呵呵), 然后考虑用户的外语能力user ability 和 单词的难易程度 difficulty两方面, 当
一个新词出现时,计算如下概率 P(yi=1 | Ui, Ti) = f(Au - Dt) Au代表user的水平,Dt代表单词的难度。
user ablitity 和 difficulty 带有两个参数,离线计算时用了logistic 回归来做; 在线计算时,用随机梯度下降来
做。 结果是连线计算预测精度会高几个百分点,但差别不大。

Yuan Quan

unread,
Feb 8, 2010, 4:38:24 AM2/8/10
to Resys
纠正一下title中的时间, 是201002008.

谷文栋

unread,
Feb 8, 2010, 4:41:55 AM2/8/10
to re...@googlegroups.com
年后回来好好给组里的同学讲讲吧。尤其是google news那个,十分期待!


2010/2/8 Yuan Quan <quany...@gmail.com>

Gary Wang

unread,
Feb 8, 2010, 5:26:31 AM2/8/10
to re...@googlegroups.com
"还有个有意思的发现时,用户一次登录浏览的新闻条数是差不多不变的,推荐不能增加浏览
的总量,只是相当于从别的渠道"偷"了些浏览来。"

这个很有意思,用户的阅读习惯一旦建立,推荐的作用就不大了,这些实验是在阅读历史多久的用户上面建立的?另外样本中每个人的阅读总量不会增加,那么总体的阅读总量会增加吗?

Quan Yuan

unread,
Feb 8, 2010, 10:43:48 AM2/8/10
to re...@googlegroups.com
这个现象可能是因为每个用户每天用来看新闻的时间和精力是有限的,比如午饭后10分钟,所以点击总量大体一致。 虽然推荐没增加点击量,但对提高用户所获取信息的速度、质量和满意度, 还是有作用的吧。
实验是选了些用户,大概是每个月点击过10个新闻的人。

2010/2/8 Gary Wang <gary.w...@gmail.com>
"还有个有意思的发现时,用户一次登录浏览的新闻条数是差不多不变的,推荐不能增加浏览
的总量,只是相当于从别的渠道"偷"了些浏览来。"

这个很有意思,用户的阅读习惯一旦建立,推荐的作用就不大了,这些实验是在阅读历史多久的用户上面建立的?另外样本中每个人的阅读总量不会增加,那么总体的阅读总量会增加吗?

xlvector

unread,
Feb 8, 2010, 9:14:22 PM2/8/10
to Resys
推荐如果能够将用户从最热门的新闻的关注上转移到长尾的关注上,可能会增加新闻网站的广告收入,因为长尾新闻页面上的广告的利润率也许会高于热门页面上
广告的利润率

On 2月8日, 下午6时26分, Gary Wang <gary.wang1...@gmail.com> wrote:
> "还有个有意思的发现时,用户一次登录浏览的新闻条数是差不多不变的,推荐不能增加浏览
> 的总量,只是相当于从别的渠道"偷"了些浏览来。"
>
> 这个很有意思,用户的阅读习惯一旦建立,推荐的作用就不大了,这些实验是在阅读历史多久的用户上面建立的?另外样本中每个人的阅读总量不会增加,那么总体的阅读总量会增加吗?
>

> 在 2010年2月8日 下午5:41,谷文栋 <wendell...@gmail.com> 写道:
>
> > 年后回来好好给组里的同学讲讲吧。尤其是google news那个,十分期待!
>

> > 2010/2/8 Yuan Quan <quanyuan...@gmail.com>

Sucirst Yie

unread,
Feb 9, 2010, 7:02:08 AM2/9/10
to re...@googlegroups.com
偷 浏览,这个概念非常重要~
 
但是这个现象是只存在于阅读推荐 还是所有推荐系统中?比如电子商务网站,用户打算买某样东西的强烈愿望是不是相关的商品推荐能打破这个浏览量恒定的规律?因为这两种推荐系统中用户的驱动力也许不是同一等级的~
--
Sucirst

Quan Yuan

unread,
Feb 9, 2010, 11:08:20 AM2/9/10
to re...@googlegroups.com
呵呵,这是个很有意思的想法,如果能找到相关的广告数据来说明的话就好了。

2010/2/9 xlvector <xlve...@gmail.com>

Quan Yuan

unread,
Feb 9, 2010, 11:16:24 AM2/9/10
to re...@googlegroups.com
个人觉得这个现象应该不存在于电子商务领域, 因为电子商务的浏览中,很典型的一类就是没有明确目标的在网店上闲逛(可能女性居多),如果在逛的过程中,发现了推荐得准的产品,就会大大增加浏览时间和销售量;否则就会很少。
这和大家在香港购物的经历也是类似的,可能一开始冲着开会而来,没有很多的购物计划。但是由于受周围的人影响(social factor), 季节性促销影响(seasonal factor),免税(local factor)等因素影响,往往会购买不少本来可买可不买的东西,从而增加逛店时间和消费额。

2010/2/9 Sucirst Yie <suc...@gmail.com>

qua...@gmail.com

unread,
Feb 9, 2010, 10:05:03 PM2/9/10
to re...@googlegroups.com
(social factor), 季节性促销影响(seasonal factor),免税(local factor),这些都可以作为推荐的因素啊,
推荐的目标是一致的,即增加销量

Super.Jiju(积聚)

unread,
Feb 10, 2010, 8:27:28 PM2/10/10
to Resys
牛头 :-)

On Feb 10, 11:05 am, quau...@gmail.com wrote:
> (social factor), 季节性促销影响(seasonal factor),免税(local factor),这些都可以作为推荐的因素啊,
> 推荐的目标是一致的,即增加销量
>

> 在 2010年2月10日 上午12:16,Quan Yuan <quanyuan...@gmail.com>写道:
>
> > 个人觉得这个现象应该不存在于电子商务领域,
> > 因为电子商务的浏览中,很典型的一类就是没有明确目标的在网店上闲逛(可能女性居多),如果在逛的过程中,发现了推荐得准的产品,就会大大增加浏览时间和销售量;否则就会很少。
> > 这和大家在香港购物的经历也是类似的,可能一开始冲着开会而来,没有很多的购物计划。但是由于受周围的人影响(social factor),
> > 季节性促销影响(seasonal factor),免税(local
> > factor)等因素影响,往往会购买不少本来可买可不买的东西,从而增加逛店时间和消费额。
>

> > 2010/2/9 Sucirst Yie <suci...@gmail.com>


>
> > 偷 浏览,这个概念非常重要~
>
> >> 但是这个现象是只存在于阅读推荐
> >> 还是所有推荐系统中?比如电子商务网站,用户打算买某样东西的强烈愿望是不是相关的商品推荐能打破这个浏览量恒定的规律?因为这两种推荐系统中用户的驱动力也许不是同一等级的~
>

ppYang

unread,
Feb 25, 2010, 4:25:48 AM2/25/10
to Resys
新闻网站可以跟bbs/博客抢浏览,感觉对于大部分用户来讲,都是差不多的消遣。
Reply all
Reply to author
Forward
0 new messages