如何使 Solr 搜索不區分大小寫？

Question

我使用 apache solr 8.7版本。

這是我用於不區分大小寫搜索的托管模式代碼。 但它沒有正常工作。

 <fieldType name="text_en_splitting" class="solr.TextField" positionIncrementGap="100" autoGeneratePhraseQueries="true">
      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <!-- in this example, we will only use synonyms at query time
        <filter class="solr.SynonymGraphFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
        -->
        <!-- Case insensitive stop word removal.
        -->
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
        <filter class="solr.FlattenGraphFilterFactory" />
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.SynonymGraphFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.StopFilterFactory"
                ignoreCase="true"
                words="lang/stopwords_en.txt"
        />
        <filter class="solr.WordDelimiterGraphFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt"/>
        <filter class="solr.PorterStemFilterFactory"/>
      </analyzer>
    </fieldType>

這是我的數據庫的一些記錄。

我希望有助於解決這個問題。

Answer 1

如果我們只想搜索“質量”字段，上面的字段類型定義對我來說似乎是過度設計的，因此會導致意想不到的結果。

我建議從最低需要的字段類型定義開始，如下所示，然后根據詞干或字母數字或同義詞搜索等要求繼續添加：

      <analyzer type="index">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>

      <analyzer type="query">
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>

這是一種自下而上的方法，當您使用新事物和許多未知變量時，它最有效。

問題中的每個過濾器工廠都有特定的用途，因此僅在您有要求時才使用。

所有 solr 過濾器工廠： https://solr.apache.org/guide/8_5/filter-descriptions.79235FDC8D8E25

如何使 Solr 搜索不區分大小寫？

問題描述

1 個解決方案

解決方案1
1 2021-10-16 10:35:13

如何使 Solr 搜索不區分大小寫？

問題描述

1 個解決方案

解決方案1 1 2021-10-16 10:35:13

解決方案1
1 2021-10-16 10:35:13