大家好, 第四次作业的成绩已经发布在课程网站
最后一次作业的难度比前几次还要大的多, 看完了这么多份用心的报告非常佩服大家的努力!
尤其是非计算机专业的同学们在这门课上面临了更多的困难, 能坚持做下来几次作业实在不容易, 大家都是好样的!
随便说一点细节,
2. 常见的问题: 跑不动/爆内存, 是不是正则表达式没有变成非贪心的? 是不是连接字符串没有用StringBuilder? 是不是在本地的main函数里访问了hdfs上的文件?
3. 对PageRank算法的理解, 从报告里能看出很多同学只是照着指南一步步做下来, 但是对于其意义还是不太了解, 这么漂亮的东西不弄懂多可惜呀~ 大家有兴趣的话可以仔细想想, 随机游走/权值分配这两种直观解释, PR值为什么守恒?(显然) 为什么要加随机跳转?(加速收敛&个性化) 为什么迭代会收敛?(这个要用线代知识啦)
如果对作业或评分有任何问题还请联系我~
谢谢大家一直以来的支持,
假期一定好好休息, 假期快乐!
bow~
助教: 李睢