![](/img/trans.png)
[英]How do I get around an out of memory error when indexing large files using Apache Lucene?
[英]When to do indexing in lucene
我有REST服務,可處理數據庫(mongodb)中的數據。 我想添加apache lucene庫來實現全文搜索。
我之前從未使用過Lucene,因此在檢查教程時試圖了解它的工作原理,但對我來說仍然不清楚的是:
何時建立數據庫數據索引? 我有數據庫,一些數據添加和刪除的頻率更高,一些數據很少更新。 我可以按所有最新數據進行搜索請求的結構應該是什么。
我是否應該在每次數據更新時都更新索引,否則它將自動完成,並且足以索引一次? 如果應該重新編制索引,那么應多久進行一次?
如果要搜索實時數據,則應在執行數據庫中的add, update and delete
數據的同時add, update and delete
lucene索引中的數據。
僅對於indexing
它會很好,但不會optimize
每個操作optimize
索引。
您可以每天一次或根據您的使用來優化索引。 優化索引將幫助您獲得更快的搜索結果。
請參考本教程 ,從Lucene的基本應用開始。
您可以為此嘗試MongoDB自己的功能(請參閱Mongo Docs )。 這可能沒有靈活性,也沒有Lucene強大,但是它是免費提供的。
您確實問了一個有問題的問題:“何時進行索引?”。 答案很大程度上取決於您的要求。 但是,您可以查看這篇文章以了解其技術上是如何完成的:脫機,即在索引編制方面您總是會落后很多。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.