[英]solr schema synonym issue
我使用此配置來搜索包含英文產品及其等效中文產品的數據。
<fieldType name="text_synm" class="solr.TextField">
<analyzer type="index">
<tokenizer class="solr.CJKTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonym.txt" ignoreCase="true" expand="false"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="1" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.CJKTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonym.txt" ignoreCase="true" expand="false"/>
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnNumerics="1" />
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
但是當我用solr admin搜索中文時,沒有結果
我試圖用
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
代替
<tokenizer class="solr.CJKTokenizerFactory"/>
但沒有結果,我確保synonym.txt是utf-8編碼
這里有什么線索嗎?
我認為我應該以任何方式編輯apach / conf / server.xml並將其添加
URIEncoding="UTF-8" useBodyEncodingForURI = "false"
以連接器標簽為例
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="UTF-8" useBodyEncodingForURI = "false" />
也在
<Connector port="8009" protocol="AJP/1.3" redirectPort="8443">
我應該添加這個
URIEncoding="UTF-8"
在我的情況下,它以任何方式無法正常工作,可能是因為我的synonym.txt文件混入了中文和英文,我希望有人能找到更高級的答案。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.