關于nutch的search介面

52 views
Skip to first unread message

懷文 許

unread,
May 26, 2013, 8:05:49 AM5/26/13
to crawlzi...@googlegroups.com
各位版上的大大好:

想請教一下各位,有沒有辦法把nutch的介面修改成不要搜尋bar,直接一進到nutch頁面就把所有爬回來的網站連結列出來~感謝大大們回覆!

Jazz Yao-Tsung Wang

unread,
May 30, 2013, 12:13:42 AM5/30/13
to crawlzi...@googlegroups.com
我剛試著用一個白痴的方法:搜尋 "http://" 會列出至少九成以上的結果。
供參考~

- Jazz


On Sun, May 26, 2013 at 8:05 PM, 懷文 許 <k12086...@gmail.com> wrote:
各位版上的大大好:

想請教一下各位,有沒有辦法把nutch的介面修改成不要搜尋bar,直接一進到nutch頁面就把所有爬回來的網站連結列出來~感謝大大們回覆!

--
You received this message because you are subscribed to the Google Groups "crawlzilla-user" group.
To unsubscribe from this group and stop receiving emails from it, send an email to crawlzilla-us...@googlegroups.com.
For more options, visit https://groups.google.com/groups/opt_out.
 
 

Jazz Yao-Tsung Wang

unread,
May 30, 2013, 12:27:42 AM5/30/13
to crawlzi...@googlegroups.com
另一種方式是用 Luke API 去讀 Nutch 產生的 Index 檔
2012 年暑期我帶實習生將 Luke 的 export To XML 改成 export To SQLite
再讓實習生把 SQLite 的資料用 PHP 讀出來,秀出全部的 URL
我想您想要的應該是這種作法。

[1] http://code.google.com/p/luke/

- Jazz



2013/5/30 Jazz Yao-Tsung Wang <ja...@nchc.narl.org.tw>
Reply all
Reply to author
Forward
0 new messages