[英]EXACT search by phrase with hyphenated word in Lucene
我在我的项目中使用 Lucene 8.3.0。 我们的用户能够执行简单搜索和精确搜索。
有一种情况是 Lucene 给出 0 结果,但预计应该找到一些结果。
我们的案例:被索引的文本:“......做一个老式曲目的概念,一个带有真正低音和喇叭的回归......”当我通过短语“an old-school track”执行搜索(不是精确搜索)时- 我得到了预期的结果。 但是,当我通过短语“老派曲目”进行精确搜索时,我什么也得不到。 同时,当我通过短语“老派”进行精确搜索时,我确实得到了我的结果。
在索引时,我使用包装到 LowerCaseFilter 中的 WhitespaceTokenizer 和 WordDelimiterGraphFilter(带有 DEFAULT_WORD_DELIM_TABLE 和这样的分隔符标志:GENERATE_WORD_PARTS、CATENATE_WORDS、PRESERVE_ORIGINAL、STEM_ENGLISH_POSSESSIVE、GENERATE_NUMBER_PARTS)。 在搜索时,我使用 WhitespaceTokenizer 和 LowerCaseFilter 并得到 0 个结果。
使用 Luke v8.0.0,我看到有这样的标记:一个 old-school oldschool 轨道。 发送到 Lucene 的请求是描述:“老式轨道”。
我究竟做错了什么? 任何想法如何实现预期的行为?
提前致谢。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.