簡體   English   中英

SOLR詞干和停用詞

[英]SOLR stemming and stopwords

在SOLR 3.5文本字段類型中,StopFilterFactory列在PorterStemFilterFactory之前。

這是否意味着,如果我想停止例如“游戲”和“游戲”,我將不得不添加兩個停頓詞?

如果是這樣會在PorterStemFilterFactory之后移動StopFilterFactory,並且只是將“游戲”添加到停用詞會導致“游戲”和“游戲”的出現被剝奪?

我想真正的問題是最好的方法是什么,我是否需要將這個詞的所有變體添加到停用詞?

PorterStemFilterFactory提供了PorterStemFilterFactory詞干,並且在停止詞過濾器之前可能不會導致正確的停止詞刪除,因為根可能與您嘗試停止的詞不同。
您可以添加復數處理,只能在停用詞過濾器之前使用solr.EnglishMinimalStemFilterFactory
這將處理復數,然后停止詞將需要處理單數形式。
然后,您可以添加PorterStemFilterFactory過濾器來處理正確的詞干。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM