[英]Does Lucene store the actual documents in its index?
我计划使用Lucene索引非常大的文本文档集。 我知道倒排索引是如何工作的。
问题:Lucene是否将实际的源文档存储在其索引中(除条款外)? 因此,如果我搜索一个术语并希望包含该术语的所有文档,这些文档是从Lucene出来的,还是Lucene只是返回指针(例如,匹配文档的文件路径)?
这取决于你。 Lucene将文档表示为字段的集合,您可以为每个字段配置是否存储它。 通常,在处理较大的文档时,您将存储标题字段,但不存储正文字段,并添加一个可用于检索实际文档的标识符字段(未索引)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.