但悲惨的现实告诉我们,目前著名的推荐引擎都依附于某个平台上,如amazon、digg、netflix等
而且,这些平台初期也不是以个性化推荐技术作为卖点的,随着数据积累规模变大才逐步体现重要性
从商业角度,个性化推荐也面临着cold start的尴尬问题
从技术角度讲,收集用户数据的确是非常困难的事情,没有数据就没有推荐,没有推荐就没人来给你贡献数据。
从商业角度看,用户对信息质量的需求可能会是更为关键的因素,之所以这样讲,基于以下几个原因:
1、推荐技术多为各大平台的附属部分,扪心自问地说:如果砍掉推荐系统是否会危机他们的主业?
2、除了我们这些信息的重度阅读者,更多的互联网用户是否有这么大的需求?
以上的质疑,是针对整个市场而提的,我觉得用户的需求、行为习惯还没有到培育出一个大的行业/市场的时机
因此目前个性化推荐技术只能存在于一些细分市场、大平台的补充环节,而很难独立成为一个巨人。
因为sina的核心部门在于编辑团队,编辑的眼光决定了新闻的流量,当未来人们的口味更趋小众时,技术会战胜编辑
这个趋势在digg身上应该是一个很好的体现吧
我把搜索引擎比喻为炸弹,推荐系统是导弹。都是信息提供的方式,搜索引擎是全面轰炸,推荐系统是定点打击。在现代战争中,炸弹导弹都是很有用的。
不过更有用的是精确制导炸弹,嘿嘿。
On 8月4日, 下午6时07分, wanght <wangh...@gmail.com> wrote:
google之前已经有很多公司培育了搜索的市场,所以google是在正确的时间正确的地点干了一件正确的事情,嘿嘿。
不过我非常赞同你对sina的看法,我也是这么想的。只是不知道这一天何时到来。
但我依然坚信,技术会革了sina这种传统新闻媒体的命,会让他的地位有如传统的纸媒一样
因为sina的核心部门在于编辑团队,编辑的眼光决定了新闻的流量,当未来人们的口味更趋小众时,技术会战胜编辑
这个趋势在digg身上应该是一个很好的体现吧
On 8月4日, 下午6时07分, wanght <wangh...@gmail.com> wrote:
这两年我们关注到,其实国外有些公司是有这个潜力的,并且正往这个方向走,从07年到现在,以mystrands为首的若干个专门做推荐的公司,陆续拿
到了几个M到几十个M的投资,就是在做这个事情。它们采用与第三方其他网站松散结合的方式,一般通过js从网页上捕获用户数据,然后将结果用rest
api返回给各网站,再按点击率或命中率相结合的方式来收费,在好几个领域都做了些成功的case,像b2c, banking, etc.
国内的话,上海麦路走的就是这条路,也是我看到的不多的走这条路的国内公司。
另外,推荐里面能否产生出一个google,我觉得更多的可能是个非技术问题。因为推荐和搜索相比,有个很不一样的特点是,搜索关注的对象是一元的,就
是item,搜索引擎的就是围绕着item,把索引、特征提取,ranking等做好; 而推荐关注的对象应该至少是二元的,除了item,还有用户、
领域等。所以一个大而强的google把互联网上的item(信息)都处理好是可行的,基于爬虫,对其他方的依赖少; 但推荐因为要考虑到用户和领域这
个维度,而用户的行为、领域的情况都是千差万别的,所以很可能就是case by case的,需要一个领域,一个公司这样的去做,才能有最好的效果;
如果想用个通用的算法,把所有的情况都统一起来,可能不是最好的办法。
一家之言,欢迎拍砖。
我自己总结了下,人在互联网上的需求,其实和人在真实社会里的需求是一致的。
以"我"为出发点,大致有这么 3 个。
一、我找物
或者泛点儿说,找内容。这个也是互联网的初衷,是第 1 条线。
这条线的发展轨迹:Directory --> Search Engine(txt --> image --> voice -->
video) --> (Human) Filter --> Recommendation --> ?。
* Directory:我不知道网上有什么,你列出来给我看。Yahoo
* Search Engine:我相信网上什么都有,我自己把它找出来。Google
* Filter:网上内容太多了,需要(专家)帮我去其糟粕取其精华。Digg,Wikipedia
* Recommendation:阿门,把我喜欢的给我吧!Amazon
二、我找人
伟人说过:"与人斗,其乐无穷"!内容是死的,不能产生互动;只有人才可以。篡改一下名言,我必须知道网络的那头是条狗----这样我给它根骨头他就过来
了。
三、我的活动
我需要物和人都找到了,后面其实和现实需求都差不多了,收藏,分享,聊天,购物,交友,娱乐。
后两个不细说了,第一个非常典型的和人们在实际社会的现状相契合。这是一个"少->多->精"的自然发展。因此,或者是
Recommendation Engine 替代掉 Search Engine;或者是 Search Engine 把
Recommendation Engine 融合进来;更现实的是两者并存互为补充。但无论如何,Recommendation Engine 一定
会有自己的一席之地,而且一定是举足轻重的。将来的 Recommendation Engine 具体的形式不好说。即使是 Amazon 这样目前
推荐系统的翘楚,是不是就一定是最好的方式,都不好说。像 Facebook 这种大平台,能给推荐带来哪些可能,都很值得思考。
我个人认为,现在还很难找到 wanght 这个问题的答案。但我坚信推荐这个方向没错,慢慢来吧,哈哈。
On Aug 4, 6:07 pm, wanght <wangh...@gmail.com> wrote:
1. 推荐系统目前最大的问题不是技术,而是没有合适的产品形态。搜索这种产品形态存在很久了,互联网之前就有,并且大家广泛接受,因此要作的是寻找更
好的技术和合适的商业模式。推荐面临的问题是没有大家认可的产品形态,只能依附在别的产品上,并且由于这个产品本身不是为推荐设计的,80%的功能不是
靠推荐来解决,推荐做得再好,也只是优化剩下的20%
2. 关于小众与大众,我的看法与上面的几位同学有点差异。用长尾理论的话来说,大众是头,小众是尾,只是我认为与长尾理论这本书说的不同,在可预见的
未来,这个头不会变平,会更尖,热的会更热。长尾很难从短头抢生意,只是头变高了,总有东西会滚下来,长尾也会变高。基本上,介入一个领域后,想作大事
情,最先满足的一定是大众的需求。大众需求的特质就是磨平个性,小众是强调个性,这就像麦当劳和精品私房菜、成衣和裁缝的关系。
3. 目前我们所讨论的基于算法的"推荐",满足的是小众的需求。这不是故意这样设计的,而是迫不得已,因为大众化的需求有其他更便捷、成本更低廉的方
式获取,用推荐来作这个,得不偿失。在获取信息的相关领域,搜索引擎满足的是大众的需求,并且性价比最高的满足了这个需求,推荐要挤进这个领域,目前只
能去作长尾。
4. 不过这并不是说推荐没得做,yahoo在做头的时候,google也在长尾里。如果推荐能够找到一种合适的形式,以更高的性价比满足大众化的信息
获取的需求--一定是大众化的,就可以反客为主。即便挤不进短头里,在长尾也不是一定没有前途。
5. 我个人倾向于推荐无法单独作为一个产品出现,但与搜索不同,推荐的应用领域不局限于互联网,并且,未来推荐很有可能作为一项基础技术的面目出现在
各种应用场合,类似模式识别技术、虚拟现实技术、触感技术等等。
> 2. 关于小众与大众,我的看法与上面的几位同学有点差异。用长尾理论的话来说,大众是头,小众是尾,只是我认为与长尾理论这本书说的不同,在可预见的
> 未来,这个头不会变平,会更尖,热的会更热。长尾很难从短头抢生意,只是头变高了,总有东西会滚下来,长尾也会变高。基本上,介入一个领域后,想作大事
> 情,最先满足的一定是大众的需求。大众需求的特质就是磨平个性,小众是强调个性,这就像麦当劳和精品私房菜、成衣和裁缝的关系。
>
> 3. 目前我们所讨论的基于算法的"推荐",满足的是小众的需求。这不是故意这样设计的,而是迫不得已,因为大众化的需求有其他更便捷、成本更低廉的方
> 式获取,用推荐来作这个,得不偿失。在获取信息的相关领域,搜索引擎满足的是大众的需求,并且性价比最高的满足了这个需求,推荐要挤进这个领域,目前只
> 能去作长尾。
这个想法有意思
>
> 4. 不过这并不是说推荐没得做,yahoo在做头的时候,google也在长尾里。如果推荐能够找到一种合适的形式,以更高的性价比满足大众化的信息
> 获取的需求--一定是大众化的,就可以反客为主。即便挤不进短头里,在长尾也不是一定没有前途。
>
> 5. 我个人倾向于推荐无法单独作为一个产品出现,但与搜索不同,推荐的应用领域不局限于互联网,并且,未来推荐很有可能作为一项基础技术的面目出现在
> 各种应用场合,类似模式识别技术、虚拟现实技术、触感技术等等。
是,任何网站都可以因为推荐系统而更好,但推荐本身很难成系统。
这就是我理解的"推荐",它不是某个产品或者网站的附属品,而就是这个信息时代的使命
On 8月5日, 上午10时56分, clickstone <wendell...@gmail.com> wrote:
> > 因此目前个性化推荐技术只能存在于一些细分市场、大平台的补充环节,而很难独立成为一个巨人。- 隐藏被引用文字 -
>
> - 显示引用的文字 -
由于不少同学是做这行的,包括我自己,因此提到"推荐",就是指个性化推荐,是CF, bayes, association rules,
SVD, MF, RBM 等等一系列技术所组成的范畴的统称。推荐的确是古已有之,排行榜是推荐,新浪的首页是推荐,搜索引擎针对关键词返回的页面是
推荐,零售超市的货架也是推荐。只是这些"推荐"不是个性化的,它不会针对某个个体作出调整。
以上的这些讨论,包括主贴,指的都是个性化推荐,而不是一般的推荐。我同意你所说的内容相对展示位过剩的说法,在用户这边,表现形式是信息过载,这是一
个硬币的两面。个性化推荐技术诞生之初,就被大家寄予厚望认为是解决这个问题的金钥匙,被认为是比排行榜、编辑推荐、搜索引擎的排序算法更能够满足用户
在这方面的需求。只是到目前为止,这项技术还没有找到适合自己的呈现形式,真正达到人们的期望。
On Aug 5, 6:17 pm, Shoukun Wang <wskin...@gmail.com> wrote:
注意到前面我小心的使用了"展示对于用户尽可能相关的内容"这样一个短语
什么是对于用户尽可能相关的?我认为,一问一答是最快接近这一目标的,表现在现有web产品上,即,搜索最相关
什么是个性化的?我认为,人类所有主动行为都是个性化的,当(系统)看到我在挠痒痒,决不是因为神经反射。因此,个性化推荐的最佳时机,发生在人当下的
主动行为(这里有个例外,就是sns推荐,这里有人的好奇心、群聚性在驱动)。
于是,我可以举一个个性化推荐的例子
我去店里买一个手机,告诉(可以是一次搜索、一次点击超链接等)业务员(推荐系统)某些条件(价格、功能、样式等),这时,业务员所作的就是一次个性化
推荐,尽管,这里任何其他人去开同样的条件,业务员的推荐list不会变。它确实不会针对某个个体作出调整,但它已经把"个性化"拿下!
难点在于如何让机器理解"个性"。
比如上一个旅游订票网站,我要求尽可能快的行程、便宜的酒店价格、更多的观光景点,请给出一些备选。这就是个性化推荐。为什么人们此时会求助于同事朋
友?因为某些个性化尚不能被机器理解,也不能被机器计算,这些推荐以经验的形式存储在人的记忆中。
我要大众点评网推荐一些好(这样那样的定义)的菜馆给我,系统又该怎么做?
所以,我对个性化推荐的理解,就是,当我主动行动时(不管是看起来目的明确与否),返回给我对应于该行为最相关的条目,我的其它个性,可以作为调剂品
其本质,不是为不同的人返回不同结果,但它还是会表现出为不同的人返回不同结果的形式----因为它能为之提供推荐的输入可以是个性化的了
> > > - 显示引用的文字 -- Hide quoted text -
>
> - Show quoted text -
On Aug 6, 12:43 am, Feng Jing <scenery...@gmail.com> wrote:
> 个人认为推荐做广告比较靠谱。其实behavior targeting都可以认为是个性化广告推荐。另外,google的interest
> ads也是。更广泛的说,amazon的推荐可以看做是站内的广告:-)。另外,推荐广告和推荐内容对推荐精度的要求也会有比较大的差别。用户是可以接受不太准确的广告的。但对推荐的内容会比较挑剔。
>
> 2009/8/5 xlvector <xlvec...@gmail.com>
On 8月6日, 下午3时21分, "Jingjing Deng (Bruce)" <bruced...@gmail.com> wrote:
> 其实国外用的蛮多的,从response model 到risk model 都有蛮多实践的东西的。
> 我们公司现在刚刚用Netflix的东西帮一个客户做risk model,效果十分不错。
>
> 2009/8/6 clickstone <wendell...@gmail.com>
所以, 目前, 推荐系统作为 a technology in search for a market, 要么是在大的information
owner内部自己开发, 要么是作为 general tool/technology/service provider for 中小用户 (已
经有很多startup在做, 像directededge), 要么找一个足够大的niche market, 专心做到最好, 比如专门推荐电影或
餐馆 (不过, 对于这一类, 成功的关键往往不是推荐系统本身, 而在于how to provide good service and
build a community.)
另一个找information source的方法是从free webpage 里慢慢淘, 由于Google已经占据这一块, 大多数做这个的都
会在早期被google收购.
这个问题,我在2006年就在琢磨,既然搜索引擎市场能培育出Google这么一个大家伙,那么推荐/发现引擎市场呢?
但悲惨的现实告诉我们,目前著名的推荐引擎都依附于某个平台上,如amazon、digg、netflix等
而且,这些平台初期也不是以个性化推荐技术作为卖点的,随着数据积累规模变大才逐步体现重要性
从商业角度,个性化推荐也面临着cold start的尴尬问题
从技术角度讲,收集用户数据的确是非常困难的事情,没有数据就没有推荐,没有推荐就没人来给你贡献数据。
从商业角度看,用户对信息质量的需求可能会是更为关键的因素,之所以这样讲,基于以下几个原因:
1、推荐技术多为各大平台的附属部分,扪心自问地说:如果砍掉推荐系统是否会危机他们的主业?
2、除了我们这些信息的重度阅读者,更多的互联网用户是否有这么大的需求?
以上的质疑,是针对整个市场而提的,我觉得用户的需求、行为习惯还没有到培育出一个大的行业/市场的时机
因此目前个性化推荐技术只能存在于一些细分市场、大平台的补充环节,而很难独立成为一个巨人。