Groups
Sign in
Groups
cs402pku
Conversations
About
Send feedback
Help
cs402pku
Contact owners and managers
1–30 of 604
Mark all as read
Report group
0 selected
Info Cim
7/16/16
Hadoop Training In Bay Area
Hadoop is a very common and powerful (raised, flat supporting surface) for working with data, but it
unread,
Hadoop Training In Bay Area
Hadoop is a very common and powerful (raised, flat supporting surface) for working with data, but it
7/16/16
Sui Li
, …
Jack Ji
3
8/12/14
Assignment4 成绩已上传
被2楼萌哭了。。。 在 2014年8月12日星期二UTC+8下午11时22分31秒,杨博文写道: 窝非常感动 助教辛苦辣 在 2014年8月10日星期日UTC+8下午11时31分57秒,Sui Li写道
unread,
Assignment4 成绩已上传
被2楼萌哭了。。。 在 2014年8月12日星期二UTC+8下午11时22分31秒,杨博文写道: 窝非常感动 助教辛苦辣 在 2014年8月10日星期日UTC+8下午11时31分57秒,Sui Li写道
8/12/14
赵一帆
, …
杨博文
8
8/6/14
regex搞出了stack overflow求破
改成<title>.+?</title>吧 在 2014年7月28日星期一UTC+8下午9时02分30秒,赵一帆写道: thx 之前不知道贪婪和懒惰,昨天好好学了一下regex,
unread,
regex搞出了stack overflow求破
改成<title>.+?</title>吧 在 2014年7月28日星期一UTC+8下午9时02分30秒,赵一帆写道: thx 之前不知道贪婪和懒惰,昨天好好学了一下regex,
8/6/14
熊嘉阳 cs402
, …
Han Jiang
6
7/29/14
关于作业问题
嗯,问题已经解决,谢谢! 2014-07-28 16:26 GMT+08:00 Han Jiang <h...@apache.org>: 其实不太理解你说的“登录服务器”是什么意思... 我们
unread,
关于作业问题
嗯,问题已经解决,谢谢! 2014-07-28 16:26 GMT+08:00 Han Jiang <h...@apache.org>: 其实不太理解你说的“登录服务器”是什么意思... 我们
7/29/14
Xin Lv
, …
赵一帆
6
7/28/14
reduce阶段如果没有收到结点的邻接表该如何处理?
留下和丢掉确实是两种结果,数据量也差很多,楼下说的没错 不过个人觉得还是留下更合理=_= 404 NOT FOUND和dangling node在用户看来只有是否具有信息量这一差别 信息在PR算法里是不
unread,
reduce阶段如果没有收到结点的邻接表该如何处理?
留下和丢掉确实是两种结果,数据量也差很多,楼下说的没错 不过个人觉得还是留下更合理=_= 404 NOT FOUND和dangling node在用户看来只有是否具有信息量这一差别 信息在PR算法里是不
7/28/14
Han Jiang
, …
杨博文
8
7/28/14
Assignment 3 成绩已上传
赞助教学长的效率QAQ 在 2014年7月28日星期一UTC+8上午11时05分15秒,Han Jiang写道: 大家好,第三次作业的成绩也已经发布在课程网站了。 http://net.pku.edu.
unread,
Assignment 3 成绩已上传
赞助教学长的效率QAQ 在 2014年7月28日星期一UTC+8上午11时05分15秒,Han Jiang写道: 大家好,第三次作业的成绩也已经发布在课程网站了。 http://net.pku.edu.
7/28/14
Jack Ji
, …
PengBo
3
7/28/14
Homework4::Extensions::(3rd)看不懂求助!
是这个意思,而且是因为pseducode中图结构会shuffle,i/o开销大, 这个task希望找到i/o更优的方法。 On Fri, Jul 25, 2014 at 11:05 PM, Jack
unread,
Homework4::Extensions::(3rd)看不懂求助!
是这个意思,而且是因为pseducode中图结构会shuffle,i/o开销大, 这个task希望找到i/o更优的方法。 On Fri, Jul 25, 2014 at 11:05 PM, Jack
7/28/14
loveh...@gmail.com
, …
Han Jiang
4
7/28/14
关于update截止时间
update指你们觉得作业不满意,可以重新提交更新的意思。 更新作业,显然就可以晚一些了。 不过如果交太晚了助教未必有时间看哟。 On Mon, Jul 28, 2014 at 8:32 PM,
unread,
关于update截止时间
update指你们觉得作业不满意,可以重新提交更新的意思。 更新作业,显然就可以晚一些了。 不过如果交太晚了助教未必有时间看哟。 On Mon, Jul 28, 2014 at 8:32 PM,
7/28/14
iama...@gmail.com
, …
Sui Li
6
7/28/14
写文件出错~求问
已解决!谢谢助教la On Monday, July 28, 2014 4:21:18 PM UTC+8, iama...@gmail.com wrote: Caused by: org.apache.
unread,
写文件出错~求问
已解决!谢谢助教la On Monday, July 28, 2014 4:21:18 PM UTC+8, iama...@gmail.com wrote: Caused by: org.apache.
7/28/14
xiongh...@gmail.com
,
Han Jiang
2
7/27/14
关于第四次作业截止时间
老师有在群里提过,是7月29号哈 On Sun, Jul 27, 2014 at 8:15 PM, <xiongh...@gmail.com> wrote: 两处显示不一样,是以8月
unread,
关于第四次作业截止时间
老师有在群里提过,是7月29号哈 On Sun, Jul 27, 2014 at 8:15 PM, <xiongh...@gmail.com> wrote: 两处显示不一样,是以8月
7/27/14
Han Jiang
, …
Han Jiang
4
7/26/14
关于作业的小建议
用最简单的正则去重后都可以出50多万条,如果考虑到[[tag|[ref]]]这种模式的话规模就更大了... 2014-07-27 10:58 GMT+08:00 郭行健 <seeker1995@
unread,
关于作业的小建议
用最简单的正则去重后都可以出50多万条,如果考虑到[[tag|[ref]]]这种模式的话规模就更大了... 2014-07-27 10:58 GMT+08:00 郭行健 <seeker1995@
7/26/14
ChengLiu
7/26/14
作业可以补交的截止日期是?
您好老师,第三次和第四次作业可以补交的截止日期能否请您明示? 谢谢
unread,
作业可以补交的截止日期是?
您好老师,第三次和第四次作业可以补交的截止日期能否请您明示? 谢谢
7/26/14
杨博文
7/25/14
D取值0.15真的大丈夫?
RT 今天码完之后用smallwiki试了一下手 感觉貌似迭代好多次之后大多数页面的PageRank还是在0.85附近晃悠
unread,
D取值0.15真的大丈夫?
RT 今天码完之后用smallwiki试了一下手 感觉貌似迭代好多次之后大多数页面的PageRank还是在0.85附近晃悠
7/25/14
zinc
, …
Han Jiang
3
7/24/14
smallwiki的格式感觉有点乱
我grep了一下,带这样pattern的: "\[\[[^]]*\[" 大都是类似于老师给的例子,一个Image加下带链接的caption,或者一个Category套着另一个
unread,
smallwiki的格式感觉有点乱
我grep了一下,带这样pattern的: "\[\[[^]]*\[" 大都是类似于老师给的例子,一个Image加下带链接的caption,或者一个Category套着另一个
7/24/14
赵一帆
,
郭行健
2
7/23/14
smallwiki的格式真的没有问题吗。。
用正则表达式吧,骚年~ 在 2014年7月23日星期三UTC+8下午10时19分54秒,赵一帆写道: 我用String.indexOf找“[[”和"]]"的位置 一开始是正常的 后来
unread,
smallwiki的格式真的没有问题吗。。
用正则表达式吧,骚年~ 在 2014年7月23日星期三UTC+8下午10时19分54秒,赵一帆写道: 我用String.indexOf找“[[”和"]]"的位置 一开始是正常的 后来
7/23/14
darkl...@gmail.com
, …
Han Jiang
8
7/22/14
作业修改后提高没有自动确认回复
没问题,那个qq邮箱发来的已经都收到了 On Tue, Jul 22, 2014 at 11:01 PM, <darkl...@gmail.com> wrote: 我还以为是进了垃圾箱
unread,
作业修改后提高没有自动确认回复
没问题,那个qq邮箱发来的已经都收到了 On Tue, Jul 22, 2014 at 11:01 PM, <darkl...@gmail.com> wrote: 我还以为是进了垃圾箱
7/22/14
郭行健
, …
Yq Peng
5
7/21/14
倒排索引在基因测序中的应用
不用……视频可以下载来看,虽然说翻墙看一般来得快一些 在 2014年7月22日星期二UTC+8上午9时20分44秒,Yq Peng写道: edx的慕课是翻墙听的么@@ 在 2014年7月18日星期五
unread,
倒排索引在基因测序中的应用
不用……视频可以下载来看,虽然说翻墙看一般来得快一些 在 2014年7月22日星期二UTC+8上午9时20分44秒,Yq Peng写道: edx的慕课是翻墙听的么@@ 在 2014年7月18日星期五
7/21/14
杨博文
, …
张雨晴
10
7/21/14
想问一句Map阶段输出的Key是根据什么被判断“是同一个Key”的
对,并被当成同一个Key处理 在 2014年7月21日星期一UTC+8上午9时51分32秒,Han Jiang写道: 我记得先前有关于SortComparator的讨论,按你的例子,你其实是希望(w1,
unread,
想问一句Map阶段输出的Key是根据什么被判断“是同一个Key”的
对,并被当成同一个Key处理 在 2014年7月21日星期一UTC+8上午9时51分32秒,Han Jiang写道: 我记得先前有关于SortComparator的讨论,按你的例子,你其实是希望(w1,
7/21/14
Krasus C
, …
Haoyan Huo
9
7/21/14
求各位指点,文件id(整数形式)是怎么实现的?
在每个Mapper的Setup里面都获取一边列表有风险,最好在commit Job之间就最好这件事吧。 On Sunday, July 20, 2014 11:48:49 PM UTC+8,
unread,
求各位指点,文件id(整数形式)是怎么实现的?
在每个Mapper的Setup里面都获取一边列表有风险,最好在commit Job之间就最好这件事吧。 On Sunday, July 20, 2014 11:48:49 PM UTC+8,
7/21/14
Han Jiang
, …
张雨晴
4
7/21/14
Tutorial: Simulating Secondary Sort on Values with Hadoop
嗯……我觉得我做的是一样的事,但输出的DF总是0,调了好久也没调出来…… 在 2014年7月21日星期一UTC+8下午5时13分41秒,Han Jiang写道: 同样的reducer会接收到划入一个
unread,
Tutorial: Simulating Secondary Sort on Values with Hadoop
嗯……我觉得我做的是一样的事,但输出的DF总是0,调了好久也没调出来…… 在 2014年7月21日星期一UTC+8下午5时13分41秒,Han Jiang写道: 同样的reducer会接收到划入一个
7/21/14
张华祥
, …
Haoyan Huo
5
7/21/14
【求教】如何才能得到单词的偏移量?
真心有用 在 2014年7月20日星期日UTC-7下午6时26分49秒,Haoyan Huo写道: java.util.regex.Matcher.start() 正是做这个的 On Sunday,
unread,
【求教】如何才能得到单词的偏移量?
真心有用 在 2014年7月20日星期日UTC-7下午6时26分49秒,Haoyan Huo写道: java.util.regex.Matcher.start() 正是做这个的 On Sunday,
7/21/14
Tss
7/21/14
弱弱得问一句, reduce task & map task 如何设置
就是上课老师讲的 launched reduced task & launched map task 我对应修改了如下设置 使用wordcount测试后发现 请问map task个数该如何设置?
unread,
弱弱得问一句, reduce task & map task 如何设置
就是上课老师讲的 launched reduced task & launched map task 我对应修改了如下设置 使用wordcount测试后发现 请问map task个数该如何设置?
7/21/14
Ylize Hsueh
,
Sui Li
2
7/21/14
Hw3_Context.collect(Text,Text)問題
怀疑是新旧api混用的问题. 把reduce函数的参数Reporter arg3去掉试试 2014-07-21 11:27 GMT+08:00 Ylize Hsueh <yunyun1113c@
unread,
Hw3_Context.collect(Text,Text)問題
怀疑是新旧api混用的问题. 把reduce函数的参数Reporter arg3去掉试试 2014-07-21 11:27 GMT+08:00 Ylize Hsueh <yunyun1113c@
7/21/14
Krasus C
, …
杨博文
10
7/20/14
Re: 杨博文-1300011443-第二次作业的补丁
Orz……这乌龙弄得 Sorry 在 2014年7月20日星期日UTC+8下午10时45分38秒,Han Jiang写道: {{说得好像还有救的样子}},你的附件已经在大家的邮箱里了 XD 2014-
unread,
Re: 杨博文-1300011443-第二次作业的补丁
Orz……这乌龙弄得 Sorry 在 2014年7月20日星期日UTC+8下午10时45分38秒,Han Jiang写道: {{说得好像还有救的样子}},你的附件已经在大家的邮箱里了 XD 2014-
7/20/14
Sui Li
, …
Hongfei Yan
3
7/20/14
Assignment 2 成绩已上传
真是认真!助教和很多同学。 -闫宏飞 2014-07-20 8:59 GMT+08:00 郭行健 <seeke...@gmail.com>: 助教gg好认真啊……赞一个 在 2014年7
unread,
Assignment 2 成绩已上传
真是认真!助教和很多同学。 -闫宏飞 2014-07-20 8:59 GMT+08:00 郭行健 <seeke...@gmail.com>: 助教gg好认真啊……赞一个 在 2014年7
7/20/14
Han Jiang
7/20/14
关于第三次作业的索引压缩
为了进行正确性测试,实现这部分功能的同学,也请写一下单机的解压缩版本哈。 功能就是读入一个索引文件,把其中内容以文本形式还原过来。还原后的文本格式随意。
unread,
关于第三次作业的索引压缩
为了进行正确性测试,实现这部分功能的同学,也请写一下单机的解压缩版本哈。 功能就是读入一个索引文件,把其中内容以文本形式还原过来。还原后的文本格式随意。
7/20/14
zinc
7/20/14
请问如何自定义InputFormat实现按句子分割
默认使用的TextInputFormat是按行分割的,我想实现一个自定义的按句号"."分割的InputFormat类,在网上找到了一个方法http://amalgjose.
unread,
请问如何自定义InputFormat实现按句子分割
默认使用的TextInputFormat是按行分割的,我想实现一个自定义的按句号"."分割的InputFormat类,在网上找到了一个方法http://amalgjose.
7/20/14
张雨晴
, …
杨博文
9
7/20/14
reducer总报出outofMemory的错误
啊对了这个代码确实posting越弄越大…… 在 2014年7月20日星期日UTC+8下午1时23分26秒,Sui Li写道: 不对, 好像是程序有问题, posting没有清空, 不同的key也会累加
unread,
reducer总报出outofMemory的错误
啊对了这个代码确实posting越弄越大…… 在 2014年7月20日星期日UTC+8下午1时23分26秒,Sui Li写道: 不对, 好像是程序有问题, posting没有清空, 不同的key也会累加
7/20/14
杨博文
,
Han Jiang
7
7/20/14
发现我程序乱扔Exception基本是因为Eclipse提交的Jar包不对
嗯,第二次作业的Patch已经发了,实现了自制继承WritableComparable的WordPair、实现了对停用词的处理、实现了大小写的处理、实现了Stripe版(Text做的伪Stripe)的
unread,
发现我程序乱扔Exception基本是因为Eclipse提交的Jar包不对
嗯,第二次作业的Patch已经发了,实现了自制继承WritableComparable的WordPair、实现了对停用词的处理、实现了大小写的处理、实现了Stripe版(Text做的伪Stripe)的
7/20/14
Krasus C
3
7/19/14
Golomb编码什么的好烦.......有没有实现好的资源= =。。。
看错了。。。是一个java额外的库有....OTZ 在 2014年7月20日星期日UTC+8上午5时31分50秒,Krasus C写道: RT
unread,
Golomb编码什么的好烦.......有没有实现好的资源= =。。。
看错了。。。是一个java额外的库有....OTZ 在 2014年7月20日星期日UTC+8上午5时31分50秒,Krasus C写道: RT
7/19/14