簡體   English   中英

Solr-通配符搜索隨提取方法的不同而不同

[英]Solr - Wild Card Search varies with Stemming Methods

我的機器上有2個版本的solr。 SolrVer1SolrVer2

SolrVer1在字段類型text_en_splitting方法下面應用了

<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
 <filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>

SolrVer2在字段類型text_en_splitting方法下面應用了

<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>

對於常規搜索,它的工作原理幾乎相同,但是在使用通配符搜索時,通配符搜索不會在SolrVer1上提供語法結果

與使用ray*搜索一樣,與SolrVer2相比, SolrVer1返回的數據要SolrVer2 當我觀察結果時,我發現SolrVer1不會僅返回rayrays返回數據。

我不知道我應該在哪里使用SnowballPorterFilterFactory以及我應該在哪里使用PorterStemFilterFactory 它們的優缺點是什么?

有人能對此行為有想法嗎?

謝謝

需要知道的詞干輸出rayrays

嘗試使用Porter stemmer在線工具阻止它們: http : //qaa.ath.cx/porter_js_demo.html 它輸出rai 這就是為什么您無法使用Porter stemmer獲得ray*任何匹配項的原因。

這是雪球阻止程序的工具: http : //snowball.tartarus.org/demo.php 這會為rayrays輸出ray ,這就是為什么要得到結果的原因。

您可能需要閱讀以下內容以比較這兩個詞干: http : //snowball.tartarus.org/texts/introduction.html

出現像滾雪球一樣的目的是為了解決波特的這些缺點。

分析儀

On wildcard and fuzzy searches, no text analysis is performed on the search word.

由於在查詢時不會對通配符搜索進行任何分析,因此將在查詢期間應用詞干提取器。
結果將取決於莖桿產生什么。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM