簡體   English   中英

Solr Ngram 過濾器后的模式替換過濾器

[英]Solr Pattern replacement filter after Ngram filter

基本上我正在嘗試在某種程度上進行拼寫更正,我正在使用前面提到的查詢分析器,

<analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0" preserveOriginal="1"/>
        <filter class="solr.LengthFilterFactory" min="2" max="100" />
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt" />
        <filter class="solr.NGramFilterFactory" minGramSize="4" maxGramSize="30" />
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>

我想將 * 添加到由 NGramFilterFactory 生成的令牌中。 對於從 NGramFilterFactory 中出現的所有令牌,如何 append *? 提前感謝您的建議。

你沒有。 使用 n-gram 是一種無需通配符即可啟用搜索的方法,並且經常使用它,因為它性能更好。

讓拼寫檢查器自己處理部分匹配並將高質量的術語輸入字典以獲得最佳結果。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM