闫老师,关于提交结果中的得分项,我有一个问题!

7 views
Skip to first unread message

何世柱

unread,
Apr 29, 2010, 10:57:23 PM4/29/10
to cwrif
闫老师:您好!
提及结果中的一项sim(相似度计算值)一定要在0-1之间吗?可以大于1或者为任意值不?当然如果必须为0-1用个回归也是可以的。另外对于外部资源的利用可以到什么程度,我可以不可以利用Google Scholar中的被引数信息? 

 祝:身体健康,万事如意!

--
您收到此邮件是因为您订阅了 Google 网上论坛的“cwirf”论坛。
要向此网上论坛发帖,请发送电子邮件至 cw...@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 cwrif+un...@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/cwrif?hl=zh-CN 访问此网上论坛。

jiangtao qiu

unread,
Apr 29, 2010, 11:04:37 PM4/29/10
to cwirf
我看在给的例子中
CT1 1 0.98 Xiao Li Microsoft Research, Redmond, WA, USA
没有把相似度作为 提交结果

相似度会作为评分标准吗?

"rank :在返回结果中文档的位次 "
这句话怎么理解?

On 4月30日, 上午10时57分, "何世柱" <heplay...@126.com> wrote:
> 闫老师:您好!
> 提及结果中的一项sim(相似度计算值)一定要在0-1之间吗?可以大于1或者为任意值不?当然如果必须为0-1用个回归也是可以的。另外对于外部资源的利用可以到什么程度,我可以不可以利用Google Scholar中的被引数信息?
>

Hongfei Yan

unread,
Apr 29, 2010, 11:04:45 PM4/29/10
to cwrif
最好规整化为0-1之间。
外部资源可以用, 提交的报告中说明就可以。

2010/4/30 何世柱 <hepl...@126.com>

Hongfei Yan

unread,
Apr 29, 2010, 11:07:11 PM4/29/10
to cwrif
没有把相似度作为 提交结果??



"rank  :在返回结果中文档的位次 "。提交结果的排序,比如你可以按照sim排序。这个是沿用TREC的,
两者意思有重复。


2010/4/30 jiangtao qiu <jiang...@gmail.com>

jiangtao qiu

unread,
Apr 29, 2010, 11:20:10 PM4/29/10
to cwirf
在领域重要文献检索结果中,有三个项目
topic-id :topic主题的编号
rank :在返回结果中文档的位次
docno : ComPaper10th集合中每篇文章记录的头部信息中的url属性对应的链接值。


但例子中,列出了4个项目,多了一个相似度。
例如:
CQ1 1 0.99 http://dx.doi.org/10.1145/1390334.1390393

我这么理解对吗
“相似度其实是用于排序的,那我们按照自己的规则排序就可以了吧,而不用一定要计算一个相似度的值。相似度的值不用于评测的计算中。”

jiangtao qiu

unread,
Apr 29, 2010, 11:34:02 PM4/29/10
to cwirf
利用外部资源会不会干扰评价结果?
如,我们的分析都是针对当前论文集合的。用google scholar查询到论文的引用数目。包括了很多没有包含在当前测评集合中的论文。
那对于一篇论文被引用的评价结果就会不一样。

Hongfei Yan

unread,
Apr 30, 2010, 1:49:36 AM4/30/10
to cwrif
谢谢提醒。少了sim一行的说明。
指南我刚更新了。请按照例子格式提交。

2010/4/30 jiangtao qiu <jiang...@gmail.com>
Reply all
Reply to author
Forward
0 new messages