繁体   English   中英

Lucene是否将实际文档存储在其索引中?

[英]Does Lucene store the actual documents in its index?

我计划使用Lucene索引非常大的文本文档集。 我知道倒排索引是如何工作的。

问题:Lucene是否将实际的源文档存储在其索引中(除条款外)? 因此,如果我搜索一个术语并希望包含该术语的所有文档,这些文档是从Lucene出来的,还是Lucene只是返回指针(例如,匹配文档的文件路径)?

这取决于你。 Lucene将文档表示为字段的集合,您可以为每个字段配置是否存储它。 通常,在处理较大的文档时,您将存储标题字段,但不存储正文字段,并添加一个可用于检索实际文档的标识符字段(未索引)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM