繁体   English   中英

如何在Lucene.Net中实现适当的模糊搜索?

[英]How to achieve proper Fuzzy search in Lucene.Net?

我在lucene.Net上做过模糊搜索。 在这一点,如果我搜索Feature ,该FeatureFeaturedfeaturing不仅要come.But数据来了,如同基于像文本匹配venturecultureture在模糊search.My码匹配是

Query query = new FuzzyQuery(new Term("ContentText", searchString));
finalQuery.Add(query, BooleanClause.Occur.SHOULD);

你应该看一下名为“Lemmatisation”的过程( http://en.wikipedia.org/wiki/Lemmatisation )。 您希望根据单词的基本形式(称为引理)构建索引 - 您应该对查询执行相同的操作。

Lucene开箱即用支持英语,所以不应该有任何问题。

您可以传递检查minimumscore属性的其他过滤器以及可以提高结果质量的minimumsimilarity属性。 我在特定场景中所做的其他事情是使用多种不同的查询类型并组合结果(过滤掉低分)并返回组合列表。 这对于像引擎这样的东西非常有效,它可以动态地“假设你的意思......”结果而不是问你“你的意思”。

您可能需要设置Parser.FuzzyMinSim

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM