簡體   English   中英

如何在Ubuntu 10.10中配置Nutch和Solr?

[英]How to configure Nutch and solr in ubuntu 10.10?

我正在嘗試為我的最后一年的項目構建一個搜索引擎。 在過去的兩個月中,我已經對該主題進行了大量研究。 我發現我將需要一個搜尋器來搜尋Internet,解析器和索引器。

我正在嘗試使用Nutch作為搜尋器和Solr來索引Nutch搜尋到的數據。 但是我被卡在了兩者的安裝部分中。 我試圖借助Internet上的教程在系統中安裝Nutch和solr,但對我沒有任何幫助。

我需要某種安裝指南或鏈接,在這里我可以學習如何安裝和集成Nutch和solr

接下來,我被解析器所困擾。 我對此階段一無所知。 在這里,我需要有關如何在建立索引之前解析數據的幫助。

我不想建立Google之類的東西。 我需要的只是要搜索某些網站上的某些項目。

我有Java經驗,可以輕松地使用它,但是我不像你們這樣的專業人員,請告訴我我是否朝着正確的方向前進,下一步該怎么做。

我正在使用Ubuntu 10.10,並且具有Apache Tomcat 7。

是Nutch的安裝, 是與Solr的集成。

關於解析器,nutch有自己的解析器集,您不必擔心解析。 觸發搜尋命令,它會自動完成。 除非您要解析除nutch提供的內容以外的其他內容,否則對您來說不是問題。 如果您想讓nutch解析一些.xyz文件,那么您就可以為此編寫解析器插件並與nutch集成。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM