[英]Java encoding with Solr and tomcat
我在Solr編碼方面遇到麻煩。 我們在兩台不同的服務器上設置了“相同”的設置,但是其中一台能夠在沒有???的情況下索引文檔。 字符,但測試服務器遇到了麻煩。
Solr結果示例:
產品服務器:
effet sur l’acquisition des connaissances »\n\n#12;#12;EFFET D’UNE SÉQUENCE
測試服務器:
effet sur l’acquisition des connaissances »\n\n��EFFET D’UNE SÉQUENCE D’ENSEIGNEMENTS
我在兩個服務器上都運行相同版本的java:
java version "1.7.0_80"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)
兩者具有相同的Java選項:
JAVA_OPTS=" -Dfile.encoding=UTF-8 "
兩個solr具有相同的Java屬性(在UI中)。
#12是什么? 意思?
問題可能在哪里?
OS:
軟件:
編輯:兩台服務器上的語言環境輸出:
LANG=en_CA.utf8
LANGUAGE=en_CA:en
LC_CTYPE="en_CA.utf8"
LC_NUMERIC="en_CA.utf8"
LC_TIME="en_CA.utf8"
LC_COLLATE="en_CA.utf8"
LC_MONETARY="en_CA.utf8"
LC_MESSAGES="en_CA.utf8"
LC_PAPER="en_CA.utf8"
LC_NAME="en_CA.utf8"
LC_ADDRESS="en_CA.utf8"
LC_TELEPHONE="en_CA.utf8"
LC_MEASUREMENT="en_CA.utf8"
LC_IDENTIFICATION="en_CA.utf8"
LC_ALL=
謝謝!
問題不在於編碼,而在於DSpace的工作方式。 我必須運行命令:
./dspace filter-media -f
此命令將從PDF重新生成.txt文件並為文檔重新編制索引。 因此,每次我嘗試使用正確的編碼為文檔建立索引時,它都不會更改任何內容。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.