使用Solr和tomcat進行Java編碼

Question

我在Solr編碼方面遇到麻煩。 我們在兩台不同的服務器上設置了“相同”的設置，但是其中一台能夠在沒有???的情況下索引文檔。 字符，但測試服務器遇到了麻煩。

Solr結果示例：
產品服務器：

effet sur l’acquisition des connaissances »\n\n#12;#12;EFFET D’UNE SÉQUENCE

測試服務器：

effet sur l’acquisition des connaissances »\n\n��EFFET D’UNE SÉQUENCE D’ENSEIGNEMENTS

我在兩個服務器上都運行相同版本的java：

java version "1.7.0_80"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)

兩者具有相同的Java選項：

JAVA_OPTS=" -Dfile.encoding=UTF-8 "

兩個solr具有相同的Java屬性（在UI中）。

＃12是什么？ 意思？

問題可能在哪里？

OS：

Ubuntu 14.04

軟件：

Tomcat 8.0.43
Dspace 6.0
Solr 4.10.4

編輯：兩台服務器上的語言環境輸出：

LANG=en_CA.utf8  
LANGUAGE=en_CA:en
LC_CTYPE="en_CA.utf8"
LC_NUMERIC="en_CA.utf8"
LC_TIME="en_CA.utf8"
LC_COLLATE="en_CA.utf8"
LC_MONETARY="en_CA.utf8"
LC_MESSAGES="en_CA.utf8"
LC_PAPER="en_CA.utf8"
LC_NAME="en_CA.utf8"
LC_ADDRESS="en_CA.utf8"
LC_TELEPHONE="en_CA.utf8"
LC_MEASUREMENT="en_CA.utf8"
LC_IDENTIFICATION="en_CA.utf8"
LC_ALL=

謝謝！

Answer 1

問題不在於編碼，而在於DSpace的工作方式。 我必須運行命令：

./dspace filter-media -f

此命令將從PDF重新生成.txt文件並為文檔重新編制索引。 因此，每次我嘗試使用正確的編碼為文檔建立索引時，它都不會更改任何內容。

使用Solr和tomcat進行Java編碼

問題描述

1 個解決方案

解決方案1
0 已采納 2017-06-16 14:33:57

使用Solr和tomcat進行Java編碼

問題描述

1 個解決方案

解決方案1 0 已采納 2017-06-16 14:33:57

解決方案1
0 已采納 2017-06-16 14:33:57