[英]Solr indexing, search stemming
我有一个问题,我有一组员工记录的索引。 全文索引基于此人的姓名和职位。
我可以在没有问题的情况下搜索像“john”这样的名字,并且像“anthon”这样的名字的一部分可以使用。
但是,有些名字不能正确搜索,例如“anthony”不会返回结果,但“anth”会返回所有的anthony's。 就像明智地寻找“carly”一样,没有任何回报,但“汽车”确实如此。
正如Maurico评论的那样,不建议人名使用Stemming。
干扰会导致人们至少出现许多意想不到的结果。
此外,检查schema.xml和应用的字段分析会很有趣。
如果您在索引和查询时使用不同的分析,则可能会发生此问题。
来自http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#Analyzers
分析器是在索引时和/或搜索时预处理输入文本的组件。 在索引和查询时使用以兼容方式处理文本的相同或类似分析器非常重要。 例如,如果索引分析器小写单词,则查询分析器应该执行相同操作以查找索引单词。
从您提到的示例中,您似乎在索引时在字段上有Stemmer,但在查询时分析中似乎不存在。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.