[英]How often to call commit on an offline Solr/Lucene index?
我知道有一些半類似的問題,但是在這種情況下,我正在構建一個脫機的索引,直到構建完成。 我從頭開始構建兩個核心,一個具有大約300k記錄,包含大量引用信息和大塊的全文本(這是文檔索引),另一個具有大約660萬記錄的全文本(這是頁面索引) )。
鑒於此索引是離線構建的,唯一真正的性能問題是構建速度。 沒有人應該查詢此數據。
如果我停止添加項目50秒鍾,自動提交顯然會觸發? 我不這樣做。 我一次添加十個,並且每隔幾秒鍾添加一次。
那么,我應該更頻繁地承諾嗎? 我覺得運行時間越長越慢,至少在我的6k文檔索引測試案例中。
沒有人搜索此索引,那么有人會建議我提交多少次?
應該說我正在使用Solr 3.1和SolrNet。
盡管提交需要花費一些時間,但您可能需要考慮進行其他調整,而不是提交頻率。
是索引核心也進行搜索,還是在索引結束后將其復制到其他地方? 如果是后者,那么關閉緩存可能會對性能產生非常明顯的影響( 每次提交時,solr都會重建緩存 )。
您還可以研究使用Solr的autoCommit或commitWith功能。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.