簡體   English   中英

Lucene索引歷史記錄/最近索引的文件

[英]Lucene Index History / Last File Indexed

有沒有辦法找出在Lucene索引中輸入的最后一個Lucene文檔? 例如,Lucene是否以某種方式跟蹤歷史記錄,或者我可以以某種方式提取已添加到索引的文件(文檔)的順序?

背景:我想建立一個包含數百萬個文檔的大型索引,該索引需要幾天的時間才能運行。 我希望有一個索引實現,該實現可以檢測添加的最后一個文件,並在再次重新啟動時在此位置繼續。

不是,不是 您獲得的最接近的結果是從索引中獲得最高的文檔ID。 如果您只是開始將文檔添加到一個空索引中,而沒有任何內容被刪除或更新,則可能什至可以工作。 但是,不能保證順序分配文檔ID。

如果您需要知道文檔添加的順序。 您應該添加一個處理該字段的字段。 日期/時間存儲的索引時間或順序ID都可以很好地使用。 盡管聽起來有點過頭,但是您只需要存儲一個標識符即可識別要從中恢復的源文檔。 在這種情況下,請在任何地方存儲該ID。 在lucene中,在數據庫中,在txt文件中,是序列化的字符串。 令您開心的事。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM