繁体   English   中英

我需要用于在Lucene中创建索引的原始文件吗?

[英]Do I need the original files used to create an index in Lucene?

首先,正如我在个人资料中所解释的那样,我不是英语母语人士,因此,如果我在语法上犯了一些错误,希望您能原谅我。

我正在尝试使用Java中的Apache Lucene API进行开发。 我能够编写一些索引和搜索方法,但是我仍然对其幕后工作方式感到困惑。

据我所知,Lucene不在乎数据的来源。 它只是获取数据并为其编制索引。 让我问一个简单的例子:

我想索引基于.txt的词典中的单词。 一旦Lucene建立了索引,我是否需要源.txt词典了吗? 索引究竟如何工作?

索引是否包含在没有原始源的情况下执行搜索所需的内容? 还是索引仅包含指向原始源.txt词典文件中单词存储位置的说明? 我有点困惑。

对所有内容建立索引后,Lucene不会引用或进一步需要任何源文档。 它需要操作的所有内容都保存在其索引目录中。 许多人使用Lucene索引文件,其他人使用数据库记录,其他人使用在线资源。 无论您采用什么来源,都必须亲自(或使用某些第三方工具)引入数据,并构造Document以便将Lucene编入索引,而有关文档的任何内容都没有说明其来源。 因此,lucene不仅不需要引用原始数据源,而且如果您愿意也无法找到原始数据源。

许多人的实现确实依赖于原始资源的存在。 人们设置Lucene为所有内容建立索引并不是什么不寻常的事,而只存储文件名,数据库ID或一些指向原始源的类似指针。 这使他们可以通过lucene执行有效的全文本搜索,同时将全部内容存储到其他系统中。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM