繁体 English 中英

我需要用于在Lucene中创建索引的原始文件吗？

[英]Do I need the original files used to create an index in Lucene?

原文 2014-11-26 18:23:07 9 1 java/ dictionary/ lucene

首先，正如我在个人资料中所解释的那样，我不是英语母语人士，因此，如果我在语法上犯了一些错误，希望您能原谅我。

我正在尝试使用Java中的Apache Lucene API进行开发。 我能够编写一些索引和搜索方法，但是我仍然对其幕后工作方式感到困惑。

据我所知，Lucene不在乎数据的来源。 它只是获取数据并为其编制索引。 让我问一个简单的例子：

我想索引基于.txt的词典中的单词。 一旦Lucene建立了索引，我是否需要源.txt词典了吗？ 索引究竟如何工作？

索引是否包含在没有原始源的情况下执行搜索所需的内容？ 还是索引仅包含指向原始源.txt词典文件中单词存储位置的说明？ 我有点困惑。

1 个解决方案

对所有内容建立索引后，Lucene不会引用或进一步需要任何源文档。 它需要操作的所有内容都保存在其索引目录中。 许多人使用Lucene索引文件，其他人使用数据库记录，其他人使用在线资源。 无论您采用什么来源，都必须亲自（或使用某些第三方工具）引入数据，并构造Document以便将Lucene编入索引，而有关文档的任何内容都没有说明其来源。 因此，lucene不仅不需要引用原始数据源，而且如果您愿意也无法找到原始数据源。

许多人的实现确实依赖于原始资源的存在。 人们设置Lucene为所有内容建立索引并不是什么不寻常的事，而只存储文件名，数据库ID或一些指向原始源的类似指针。 这使他们可以通过lucene执行有效的全文本搜索，同时将全部内容存储到其他系统中。

用于创建Lucene索引的分析器

[英]Analyzer used to create Lucene index

如何在Lucene 3.0.2中索引和搜索文本文件？

[英]How do I index and search text files in Lucene 3.0.2?

如何使用Lucene索引和搜索结构文本文件？

[英]How do I use Lucene to index and search structure text files?

我正在尝试通过SOLR和Lucene为文档中的文件建立索引。

[英]I'm trying to index files in a document through SOLR and lucene..

Lucene索引文件已损坏

[英]Lucene Index files getting Corrupted

lucene 索引文件随机崩溃，需要重新索引

[英]lucene index file randomly crash and need to reindex

如何持久化Lucene文档索引，以便在每次程序启动时都不需要将文档加载到其中？

[英]How to persist the Lucene document index so that the documents do not need to be loaded into it each time the program starts up?

我可以用Lucene索引RDB吗？

[英]Can I index RDB with lucene?

在Lucene索引中修改.tim和.tip文件

[英]Modifying .tim and .tip files in Lucene Index

在Java中使用Lucene索引Markdown文件

[英]Index Markdown Files Using Lucene in Java

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 用于创建Lucene索引的分析器如何在Lucene 3.0.2中索引和搜索文本文件？如何使用Lucene索引和搜索结构文本文件？我正在尝试通过SOLR和Lucene为文档中的文件建立索引。 Lucene索引文件已损坏 lucene 索引文件随机崩溃，需要重新索引如何持久化Lucene文档索引，以便在每次程序启动时都不需要将文档加载到其中？我可以用Lucene索引RDB吗？在Lucene索引中修改.tim和.tip文件在Java中使用Lucene索引Markdown文件

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM