2013/10/29 雷逸志
> 謝謝老師您耐心的回覆,如您所述的確是使用者名稱的問題,托您的幫忙該問題已順利解決!
> 但接著我在一台vm上安裝成功後(Single node),於是我就去啟動namenode,結果卻無法開啟。
> 系統訊息如下:先連續跑出三次的「localhost's namenode not work, starting now ...」接著是
>「ERROR! localhost's namenode starting failed, please check /var/log/crawlzilla/hadoop-logs/hadoop-crawler-namenode-*.log」。
> 但在此目錄中並未出現附檔名為log之檔案,只有以下3個執行檔「hadoop-crawler-namenode-*.out」、「hadoop-crawler-namenode-*.out1」與「hadoop-crawler-namenode-*.out2」,而內文皆為
> 「/opt/crawlzilla/nutch/bin/hadoop: line 258: /usr/lib/jvm/java-6-sun/bin/java: 沒有此一檔案或目錄」以及「/opt/crawlzilla/nutch/bin/hadoop: line 289: /usr/lib/jvm/java-6-sun/bin/java: 沒有此一檔案或目錄」,兩行。
> 1. 我已經有安裝oracle java6,也確實有找到 /usr/lib/jvm/java-6-sun/bin/java 此檔案,與out檔案的內文完全矛盾。
> 2. 另外覺得奇怪的是,每次我去啟動namenode後,在 /var/log/crawlzilla/hadoop-logs/ 所產生的檔案並非系統訊息所謂的log檔,卻是產生如上三個副檔名為out的執行檔。
> 3. 或者是我以上過程少考慮了哪些步驟呢?
> 這次的問題較多,真的麻煩老師您過目了,
> 也再次謝謝老師您詳細的解答,讓我們這些第一次接觸Crawlzilla的新手們受益良多!
感覺上是 Java 版本的問題。
如果您只是想要嘗試使用 Crawlzilla 的話,我們有製作一個 Crawlzilla 1.1.2 版本的 OVF Image。
您可以至以下網址下載,並在 VirtualBox 用匯入的方式啟用。
http://cloud.nchc.org.tw/download/crawlzilla_1.1.2.ova
礙於 Crawlzilla 設定檔中有許多涉及網路,考量每個使用者執行時會取得不同 IP 位址。
因此設定上暫設定為 localhost ,亦因此只能單機執行。
如需架設多台 VM 形成叢集式的環境,再另外協助您架設。
關於此虛擬機器的資訊:
作業系統:Debian Linux 6.0.7 (Squeeze)
Java版本:Oracle JDK/JRE 6.0
Crawlzilla:1.1.2
Linux 使用者:user / 密碼: crawlzilla
Crawlzilla 管理者可以將虛擬機器的 8080 port 通透到 NAT 之外,
或連線到
http://虛擬機器 IP : 8080
會讓您設定新的密碼跟管理者 e-mail
以上,若 VM 使用上有問題,或者希望建立叢集式的環境,
歡迎再與敝團隊討論。
- Jazz