簡體   English   中英

Solr / Lucene清除索引中已刪除文檔的過程是什么?

[英]What is the Solr/Lucene process to purge deleted documents in index?

當索引中有一些已刪除的文檔(在通過查詢刪除之后)時,清除索引的過程是什么?

我問這個問題是因為我正在一個基於solr的項目中,我已經注意到一個奇怪的行為,我想了解一些有關它的信息。

我的系統具有以下功能:

  • 我的文檔連續索引(每秒1000docs)

  • 此查詢每隔幾秒鍾執行一次清除:

     <delete><query>timestamp_utc:[ * TO NOW-10MINUTES ]</query></delete> 

因此,我每次都能在索引中看到600000個文檔:10分鍾* 60 = 600秒,速度= 1000docs / s,所以600 * 1000 = 600000

但是我的索引大小隨時間增加。 而且我知道,當您通過查詢執行刪除操作時,文檔會受到“刪除”標簽或索引中類似內容的影響。

我已經看過並嘗試使用屬性“ expungeDeletes = true”,但是我沒有注意到索引大小有很大變化。

有關索引清除過程的任何信息將不勝感激。

謝謝。

編輯

我知道優化程序可以完成這項工作,但是這是一個漫長的過程,我想避免這樣做。

您可以每10分鍾創建一個新的集合/核心,切換到該集合/核心(加上前一個),然后刪除最早的集合/核心(超過10分鍾)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM