繁体   English   中英

准备doc和docx文件以进行Lucene索引编制

[英]Prepare doc and docx Files for Lucene indexing

我想问一下是否有一种将文档内容放入单个文档字段的快速方法。 我所看到的所有示例都有相对较短的字符串。 我无法将整个期刊文章保存到字符串和索引中,那是一种快速的方法来告诉lucene索引文件中的所有单词吗? 我正在为此应用程序使用Lucene.net 3.03。

没有一种简单的方法可以仅传递文件,您必须将所有内容提供给lucene才能为搜索建立索引。 是来自Q / A的有关为PDF编制索引的答案,但是对于每种类型的文档都是相同的,只需打开它并为lucene编制索引即可。

您只需将System.IO.TextReader传递给Field 如果文件是纯文本或类似的文件,则应该能够在其上打开阅读器,然后将其直接传递到字段中,例如:

System.IO.TextReader reader = new StreamReader("path/to/my/file.txt");
Field field = new Field("fieldName", reader);
document.add(field);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM