Solr-通配符搜索隨提取方法的不同而不同

Question

我的機器上有2個版本的solr。 說SolrVer1和SolrVer2

SolrVer1在字段類型text_en_splitting方法下面應用了

<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
 <filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>

SolrVer2在字段類型text_en_splitting方法下面應用了

<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>

對於常規搜索，它的工作原理幾乎相同，但是在使用通配符搜索時，通配符搜索不會在SolrVer1上提供語法結果

與使用ray*搜索一樣，與SolrVer2相比， SolrVer1返回的數據要SolrVer2 。 當我觀察結果時，我發現SolrVer1不會僅返回ray和rays返回數據。

我不知道我應該在哪里使用SnowballPorterFilterFactory以及我應該在哪里使用PorterStemFilterFactory 。 它們的優缺點是什么？

有人能對此行為有想法嗎？

謝謝

Answer 1

需要知道的詞干輸出ray ， rays 。

嘗試使用Porter stemmer在線工具阻止它們： http : //qaa.ath.cx/porter_js_demo.html 。 它輸出rai ！ 這就是為什么您無法使用Porter stemmer獲得ray*任何匹配項的原因。

這是雪球阻止程序的工具： http : //snowball.tartarus.org/demo.php 。 這會為ray和rays輸出ray ，這就是為什么要得到結果的原因。

您可能需要閱讀以下內容以比較這兩個詞干： http : //snowball.tartarus.org/texts/introduction.html

出現像滾雪球一樣的目的是為了解決波特的這些缺點。

Answer 2

分析儀

On wildcard and fuzzy searches, no text analysis is performed on the search word.

由於在查詢時不會對通配符搜索進行任何分析，因此將在查詢期間應用詞干提取器。
結果將取決於莖桿產生什么。

Solr-通配符搜索隨提取方法的不同而不同

問題描述

2 個解決方案

解決方案1
1 已采納 2012-08-23 22:09:53

解決方案2
0 2012-08-24 07:34:31

Solr-通配符搜索隨提取方法的不同而不同

問題描述

2 個解決方案

解決方案1 1 已采納 2012-08-23 22:09:53

解決方案2 0 2012-08-24 07:34:31

解決方案1
1 已采納 2012-08-23 22:09:53

解決方案2
0 2012-08-24 07:34:31