使用SOLR和LowerCaseFilterFactory索引字段

Question

我有一個字段定義為

<fieldType name="text_ws_lc" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

對於此類型的字段，在沒有區分大小寫的情況下搜索效果很好。 但是我希望插入到字段中的原始值不是小寫值。 是否可以從索引分析器中刪除LowerCaseFilterFactory並獲得此功能？ 翼

<fieldType name="text_ws_lc_std" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

Answer 1

您應該定義兩個字段：一個用小寫的值用於搜索，另一個用於保存原始值。 您可以在schema.xml中使用復制字段指令來保持兩個字段同步。

使用SOLR和LowerCaseFilterFactory索引字段

問題描述

1 個解決方案

解決方案1
8 已采納 2010-06-28 19:03:05

使用SOLR和LowerCaseFilterFactory索引字段

問題描述

1 個解決方案

解決方案1 8 已采納 2010-06-28 19:03:05

解決方案1
8 已采納 2010-06-28 19:03:05