Re: Re: Re: cwirf的pdf文章数量不对

10 views
Skip to first unread message

Hongfei Yan

unread,
Apr 21, 2010, 3:44:40 AM4/21/10
to cwrif
请重新下载ACL这几年的文章数据。原因如下。

updated, please download again
是文件名中有/的问题,更正了你提到的这些。

1979,http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1979-ACL
1981,  http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1981-ACL
1982, http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1982-ACL
1984, 这年有联合会议,所以文章多
http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1984-ACL
2005,
2000,
1985

best,
-Hongfei

On Wed, Apr 21, 2010 at 3:39 PM, Hongfei Yan <yhf...@gmail.com> wrote:
我来找找ACL其他年份,看是否有问题。

2010/4/21 Liu Guojun <liuguo...@gmail.com>
如果这样的话,看来后面的ACL有些年份也有或多或少的问题。因为我只对比了1979-1984年的。
更新后的1984年的文章篇数跟网页上是一样的了。

在 2010年4月21日 下午3:22,Hongfei Yan <yhf...@gmail.com>写道:

谢谢你的反馈。

updated, please download the following files again
是文件名中有/的问题,更正了你提到的这些。

1979,http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1979-ACL
1981,  http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1981-ACL
1982, http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1982-ACL
1984, 这年有联合会议,所以文章多
http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/ACL/Tianwang.raw.1984-ACL



2010/4/21 Liu Guojun <liuguo...@gmail.com>

闫老师,我人工数了一下ACL缺的篇数:1979 少25篇,1981少1篇,1982少33篇,1984少105(我解压到的只有11篇,但网页上说有116篇,我觉得有点奇怪,从这个会议早起看来,应该不可能出现80年代的时候每年录用100+篇)。后面的年代我就没有一一对比了

在 2010年4月21日 上午8:53,liuguojun.pku <liuguo...@gmail.com>写道:

我是直接用 ls | wc -l 的不能定位到哪一年
 
 
2010-04-21

 天行健,君子以自强不息

发件人: Hongfei Yan
发送时间: 2010-04-21  00:00:00
收件人: liuguojun.pku
抄送:
主题: Re: Re: cwirf的pdf文章数量不对
哪一年能定位到吗?就是你的程序输出发给我。

2010/4/20 liuguojun.pku <liuguo...@gmail.com>
现在WWW的统计出来差一篇,KDD差一篇,TOIS差5篇,IPDPS多2篇,ACL差350篇,EACL差5篇,NAACL差160篇
 
 
2010-04-20

 天行健,君子以自强不息

发件人: Hongfei Yan
发送时间: 2010-04-20  23:32:07
收件人: Liu Guojun
抄送:
主题: Re: cwirf的pdf文章数量不对
网上下载会议论文的时候,有些下载出错了,每个proceeding是1~4月份逐渐统计出来的,之间有的重新进行了下载,那个
数字忘记改了。

我重新统计了一下,请刷新
http://www.cwirf.org/2010WebTrack/lt/ComPaper10th/README

但是SIGIR没有差20多篇。你哪次会议的数目不对,麻烦告知我?
不要在window机器操作,因为文件名中有冒号window不支持,该文件释放不出来。


2010/4/20 Liu Guojun <liuguo...@gmail.com>
闫老师,我用你给的那个天网工具从raw文件中抽出pdf,但是发现最后得到的pdf文章篇数和这里公布的有差距,像SIGIR这种大概差20多篇。我统计了一下,最后总数上大概会差200篇。
不知道这是什么原因,是工具的问题,还是?

--
天行健,君子以自强不息





--
天行健,君子以自强不息




--
天行健,君子以自强不息


--
您收到此邮件是因为您订阅了 Google 网上论坛的“cwirf”论坛。
要向此网上论坛发帖,请发送电子邮件至 cw...@googlegroups.com
要取消订阅此网上论坛,请发送电子邮件至 cwrif+un...@googlegroups.com
若有更多问题,请通过 http://groups.google.com/group/cwrif?hl=zh-CN 访问此网上论坛。

Liu Guojun

unread,
Apr 21, 2010, 5:09:31 AM4/21/10
to cw...@googlegroups.com
现在唯一出入比较大的就是NAACL的了,其他的会议即使相差的话,也不过一两篇而已。
不知NAACL会不会有和ACL一样的问题?

Hongfei Yan

unread,
Apr 21, 2010, 8:01:18 AM4/21/10
to cwrif
谢谢反馈。同样的问题,现更正,麻烦大家重新下载
NAACL的 2006,2007,2009

2010/4/21 Liu Guojun <liuguo...@gmail.com>
Reply all
Reply to author
Forward
0 new messages