[英]Solr - Wild Card Search varies with Stemming Methods
我的機器上有2個版本的solr。 說SolrVer1
和SolrVer2
SolrVer1
在字段類型text_en_splitting
方法下面應用了
<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
<filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>
SolrVer2
在字段類型text_en_splitting
方法下面應用了
<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>
對於常規搜索,它的工作原理幾乎相同,但是在使用通配符搜索時,通配符搜索不會在SolrVer1
上提供語法結果
與使用ray*
搜索一樣,與SolrVer2
相比, SolrVer1
返回的數據要SolrVer2
。 當我觀察結果時,我發現SolrVer1
不會僅返回ray
和rays
返回數據。
我不知道我應該在哪里使用SnowballPorterFilterFactory
以及我應該在哪里使用PorterStemFilterFactory
。 它們的優缺點是什么?
有人能對此行為有想法嗎?
謝謝
需要知道的詞干輸出ray
, rays
。
嘗試使用Porter stemmer在線工具阻止它們: http : //qaa.ath.cx/porter_js_demo.html 。 它輸出rai
! 這就是為什么您無法使用Porter stemmer獲得ray*
任何匹配項的原因。
這是雪球阻止程序的工具: http : //snowball.tartarus.org/demo.php 。 這會為ray
和rays
輸出ray
,這就是為什么要得到結果的原因。
您可能需要閱讀以下內容以比較這兩個詞干: http : //snowball.tartarus.org/texts/introduction.html
出現像滾雪球一樣的目的是為了解決波特的這些缺點。
On wildcard and fuzzy searches, no text analysis is performed on the search word.
由於在查詢時不會對通配符搜索進行任何分析,因此將在查詢期間應用詞干提取器。
結果將取決於莖桿產生什么。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.