启动任务的脚本等前三个结束了,再启动第四个,可以不。
--
You received this message because you are subscribed to the Google Groups "Hadoop In China" group.
To post to this group, send email to hadoo...@googlegroups.com.
To unsubscribe from this group, send email to hadooper_cn...@googlegroups.com.
For more options, visit this group at http://groups.google.com/group/hadooper_cn?hl=en.
启动的时候记录一下jobid,然后定时检查结束的jobid,找到成功结束的三个之后,启动第四个job.
这个其实就是MR的任务流,可以看作一个DAG图。
目前,Hive,Pig都可以解决这个问题,这两个一个从sql一个从脚本都解决了这个问题。
还有,oozie也是专门解决这个问题的,这个呢,就是纯粹的MR了。
当然还有其他方式,可以去找下。如果没什么更多的需求,oozie就够了,如果觉得MR任务写起来比较复杂,那么就是hive或者pig了。
--