Solr output

33 views
Skip to first unread message

Joseph Lim

unread,
Feb 18, 2013, 2:50:08 AM2/18/13
to crawlzi...@googlegroups.com
请问一下,
如果我要把solr的outPut dir改到别的slave去,我该什么configure?
谢谢

Shun-Fa Yang

unread,
Feb 18, 2013, 3:03:11 AM2/18/13
to crawlzi...@googlegroups.com
您好,

solr所產生的output index file位於solr/example/solr/collection1,
目前我只有試過修改solr output index file路徑,作法如下:
Step 1. cp -r collection1 newCollection
Step 2. 修改solr.xml
<core schema="schema.xml" instanceDir="newCollection/" name="newCollection" config="solrconfig.xml" dataDir="data"/>
Step3. 使用nutch 建立index時,位址也需做對應修改

至於搬至其他slave,目前沒有試過,也許透過上述方法可以提供你一些想法。


Joseph Lim於 2013年2月18日星期一UTC+8下午3時50分08秒寫道:
请问一下,
如果我要把solr的outPut dir改到别的slave去,我该什么configure?
谢谢

Joseph Lim

unread,
Feb 28, 2013, 5:48:38 AM2/28/13
to crawlzi...@googlegroups.com
您好,

请问一下下,如果我不把Solr的output 放在别的machine 里。旦要把solr的output dir自动的放进hdfs里,有可能吗?

谢谢您了。

Jazz Yao-Tsung Wang

unread,
Mar 1, 2013, 9:44:51 AM3/1/13
to crawlzi...@googlegroups.com
今天跟 Shun-Fa 討論了一下,應該是可以。
不過細部設定還是需要測試一下。有答案再跟您說~

Joseph Lim於 2013年2月28日星期四UTC+8下午6時48分38秒寫道:

Joseph Lim

unread,
Mar 1, 2013, 9:55:51 PM3/1/13
to crawlzi...@googlegroups.com
太感谢你了,我期待着您的答复~ 同时,我会继续做一些尝试...

Shun-Fa Yang

unread,
Mar 3, 2013, 9:48:10 PM3/3/13
to crawlzi...@googlegroups.com
您好,

方便詢問一下是什麼樣的需求需要將solr的output keep在HDFS或是修改output的路徑?

感謝

Joseph Lim於 2013年3月2日星期六UTC+8上午10時55分51秒寫道:

Joseph Lim

unread,
Mar 3, 2013, 11:19:40 PM3/3/13
to crawlzi...@googlegroups.com
您好 Shun-Fa,

因为crawlzilla已经使用hadoop,  將solr的output keep在HDFS, 在server出现故障时,还有好几个副本在HDFS.

如果我说明错了,请纠正我. 我是个hadoop/nutch/solr 菜鸟 =)

Joseph Lim

unread,
Mar 6, 2013, 3:02:09 AM3/6/13
to crawlzi...@googlegroups.com
您好,

想问Crawlzilla 的 solr能够安装以下的patch吗?

https://issues.apache.org/jira/browse/SOLR-1301

谢谢...
Reply all
Reply to author
Forward
0 new messages