想问一句Map阶段输出的Key是根据什么被判断“是同一个Key”的

62 views
Skip to first unread message

杨博文

unread,
Jul 19, 2014, 4:24:41 PM7/19/14
to cs40...@googlegroups.com
RT
Key的equals(key)还有compareTo(key)貌似都不是

Krasus C

unread,
Jul 19, 2014, 5:32:21 PM7/19/14
to cs40...@googlegroups.com
按理说应该是compareTo吧。。

在 2014年7月20日星期日UTC+8上午4时24分41秒,杨博文写道:
RT
Key的equals(key)还有compareTo(key)貌似都不是

张雨晴

unread,
Jul 20, 2014, 6:06:19 AM7/20/14
to cs40...@googlegroups.com
同问……

PengBo

unread,
Jul 20, 2014, 9:10:38 PM7/20/14
to cs402pku
哪里要判断是“同一个”key?


同问……

在 2014年7月20日星期日UTC+8上午4时24分41秒,杨博文写道:
RT
Key的equals(key)还有compareTo(key)貌似都不是

--
You received this message because you are subscribed to the Google Groups "cs402pku" group.
To unsubscribe from this group and stop receiving emails from it, send an email to cs402pku+u...@googlegroups.com.
To post to this group, send email to cs40...@googlegroups.com.
Visit this group at http://groups.google.com/group/cs402pku.
For more options, visit https://groups.google.com/d/optout.

杨博文

unread,
Jul 20, 2014, 9:48:14 PM7/20/14
to cs40...@googlegroups.com
这个问题是在做WordPair的时候想到的
如果自己实现了个继承WritableComparable的WordPair结构
如何让(w1,w2)和(w2,w1)成为同一个Key?

在 2014年7月21日星期一UTC+8上午9时10分38秒,PengBo写道:

Han Jiang

unread,
Jul 20, 2014, 9:51:32 PM7/20/14
to cs402pku
我记得先前有关于SortComparator的讨论,按你的例子,你其实是希望(w1, w2)和(w2,w1)被同一个reducer接收到?

https://groups.google.com/forum/#!topic/cs402pku/GbGu3Ds-LLQ
--
Han Jiang

Team of Search Engine and Web Mining,
School of Electronic Engineering and Computer Science
,
Peking University, China

张雨晴

unread,
Jul 21, 2014, 2:17:29 AM7/21/14
to cs40...@googlegroups.com, h...@apache.org
很有用!就是这个问题,但第二个链接是:http://sonerbalkir.blogspot.com/2010/01/simulating-secondary-sort-on-values.html
好像打不开……


在 2014年7月21日星期一UTC+8上午9时51分32秒,Han Jiang写道:

Han Jiang

unread,
Jul 21, 2014, 2:21:39 AM7/21/14
to cs402pku
那是blogspot,需要代理吧。

我贴到这个google docs里了:

https://docs.google.com/document/d/1haf4YQp_-2e0TM7WdxArE7V4DzC8Q0UiPGEuDL4lxjM/edit?usp=sharing

张雨晴

unread,
Jul 21, 2014, 2:38:28 AM7/21/14
to cs40...@googlegroups.com, h...@apache.org
还是上不去。。。


在 2014年7月21日星期一UTC+8下午2时21分39秒,Han Jiang写道:

杨博文

unread,
Jul 21, 2014, 11:28:38 AM7/21/14
to cs40...@googlegroups.com, h...@apache.org
对,并被当成同一个Key处理

在 2014年7月21日星期一UTC+8上午9时51分32秒,Han Jiang写道:
Reply all
Reply to author
Forward
0 new messages