簡體   English   中英

Solr模式同義詞問題

[英]solr schema synonym issue

我使用此配置來搜索包含英文產品及其等效中文產品的數據。

        <fieldType name="text_synm" class="solr.TextField">
        <analyzer type="index">

        <tokenizer class="solr.CJKTokenizerFactory"/>

            <filter class="solr.SynonymFilterFactory" synonyms="synonym.txt" ignoreCase="true" expand="false"/>
              <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="1" />
               <filter class="solr.LowerCaseFilterFactory"/>

        </analyzer>

        <analyzer type="query">

            <tokenizer class="solr.CJKTokenizerFactory"/>

              <filter class="solr.SynonymFilterFactory" synonyms="synonym.txt" ignoreCase="true" expand="false"/>
              <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="1" />
               <filter class="solr.LowerCaseFilterFactory"/>

        </analyzer>
    </fieldType>

但是當我用solr admin搜索中文時,沒有結果

我試圖用

<tokenizer class="solr.WhitespaceTokenizerFactory"/>

代替

<tokenizer class="solr.CJKTokenizerFactory"/>

但沒有結果,我確保synonym.txt是utf-8編碼

這里有什么線索嗎?

我認為我應該以任何方式編輯apach / conf / server.xml並將其添加

URIEncoding="UTF-8" useBodyEncodingForURI = "false"

以連接器標簽為例

    <Connector port="8080" protocol="HTTP/1.1" 
           connectionTimeout="20000" 
           redirectPort="8443" URIEncoding="UTF-8" useBodyEncodingForURI = "false" />

也在

 <Connector port="8009" protocol="AJP/1.3" redirectPort="8443">

我應該添加這個

URIEncoding="UTF-8"

在我的情況下,它以任何方式無法正常工作,可能是因為我的synonym.txt文件混入了中文和英文,我希望有人能找到更高級的答案。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM