[英]How to use GetFiles() search to include doc files but excude docx files?
[英]Prepare doc and docx Files for Lucene indexing
我想问一下是否有一种将文档内容放入单个文档字段的快速方法。 我所看到的所有示例都有相对较短的字符串。 我无法将整个期刊文章保存到字符串和索引中,那是一种快速的方法来告诉lucene索引文件中的所有单词吗? 我正在为此应用程序使用Lucene.net 3.03。
没有一种简单的方法可以仅传递文件,您必须将所有内容提供给lucene才能为搜索建立索引。 这是来自Q / A的有关为PDF编制索引的答案,但是对于每种类型的文档都是相同的,只需打开它并为lucene编制索引即可。
您只需将System.IO.TextReader
传递给Field
。 如果文件是纯文本或类似的文件,则应该能够在其上打开阅读器,然后将其直接传递到字段中,例如:
System.IO.TextReader reader = new StreamReader("path/to/my/file.txt");
Field field = new Field("fieldName", reader);
document.add(field);
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.