簡體   English   中英

Lucene是否將實際文檔存儲在其索引中?

[英]Does Lucene store the actual documents in its index?

我計划使用Lucene索引非常大的文本文檔集。 我知道倒排索引是如何工作的。

問題:Lucene是否將實際的源文檔存儲在其索引中(除條款外)? 因此,如果我搜索一個術語並希望包含該術語的所有文檔,這些文檔是從Lucene出來的,還是Lucene只是返回指針(例如,匹配文檔的文件路徑)?

這取決於你。 Lucene將文檔表示為字段的集合,您可以為每個字段配置是否存儲它。 通常,在處理較大的文檔時,您將存儲標題字段,但不存儲正文字段,並添加一個可用於檢索實際文檔的標識符字段(未索引)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM