繁体   English   中英

创建Lucene索引时如何设置最小词频?

[英]How can I set the minimum term frequency when creating a lucene index?

首先,我不得不说我对Lucene完全陌生,因此我的问题可能有点愚蠢。

我想做的是创建一个索引,该索引包含在文档中出现至少特定次数的术语。 我想这样做的原因是,我试图搜索一个只出现两次且结果为零的术语。 我试图找到可以调整此参数的位置,但没有成功。 我使用Luke查看了索引,似乎该术语未出现在索引文件中。

我必须使用的Lucene版本是2.0,因为我必须使用另一个仅适用于2.0版索引文件的库。

我将对这个问题有任何提示。 非常感谢你!

根据您对我的评论的回答,您可以通过创建分析器来管理停用词词典

StandardAnalyzer(文件停用词)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM