如果利用tag,基本可以做到21%左右。如果有人能做到25%以上,基本可以发文章了,哈哈
On Nov 26, 8:24 pm, "王立才" <wiiz...@gmail.com> wrote:
> 刚才huizi liang说到标签中包含很多噪音;我不太了解标签推荐系统怎么计算和分析user-item-tag的,不知道下面的感触是否和噪音有关??
>
> 在用citeUlike时,需要自己添加tags, 我填的时候基本就直接按照关键词、标题名字、以及自己的理解填写,但往往一个领域的相关概念被分成好几个标签:
> 比如,我比较关注context-aware RS和contextual user preference, 关于context的tags就包括:context contextual context-aware context-modelling context-sensitive context-computing等,关于RS的tags包括recommender_systems recommender recommendation。
>
> tag-RS要计算他们的相似度或者关联度吗?要把他们聚为同一类tag吗(我的tags列表里面有好多tag值为1)?
>
> 我们组只是在tag这方面做得比较早些, 07年开始做的,投了个IUI 08的 paper (Improved Recommendation based on Collaborative Tagging Behaviors), 因该是用tag来做推荐的第一批人了。 因为user-item(page)-tag 是个经典的三元组结构, 后来我们还试了很多方法,比如在图上,tensor, 包括现在在用矩阵分解的方法在做。
>
> 从对tag的使用上来看,tag即可以作为recommender 的input;也可以作为output,向用户推荐tag。在下下次的聚会中,我和我的同事打算做个social recommender 的talk, 其中tag-based recommender 是其中的一部分。
>
> 2009/11/26 谷文栋 <wendell...@gmail.com>
>
> @huizi liang,你在北京吗?明年1月份,Resys会搞一个ibm crl的专场topic,我听 Yuan Quan 说里面应该有一部分是 tag 相关的。Yuan Quan 他们team是这方面的大拿,到时候欢迎你来和他们PK,哈哈。
>
我又随机点了几个人或群组的tags,发现也都是这种类似的分布。。
如果citeUlike公开了数据,是否可以分析下每个人的tags是否符合“长尾理论”??
我发邮件想申请一个access,两天过去了,还没有回音啊?
是不是有什么要求的?
The latest data snapshot can always be downloaded at http://static.citeulike.org/data/current.bz2
Older datasets are available on a daily basis and can be found at URLs of the form http://static.citeulike.org/data/2007-05-30.bz2
老数据不需要许可,可以直接下载,新数据集得要access。