簡體   English   中英

使用Solr和tomcat進行Java編碼

[英]Java encoding with Solr and tomcat

我在Solr編碼方面遇到麻煩。 我們在兩台不同的服務器上設置了“相同”的設置,但是其中一台能夠在沒有???的情況下索引文檔。 字符,但測試服務器遇到了麻煩。

Solr結果示例:
產品服務器:

effet sur l’acquisition des connaissances »\n\n#12;#12;EFFET D’UNE SÉQUENCE  

測試服務器:

effet sur l’acquisition des connaissances »\n\n��EFFET D’UNE SÉQUENCE D’ENSEIGNEMENTS

我在兩個服務器上都運行相同版本的java:

java version "1.7.0_80"
Java(TM) SE Runtime Environment (build 1.7.0_80-b15)
Java HotSpot(TM) 64-Bit Server VM (build 24.80-b11, mixed mode)

兩者具有相同的Java選項:

JAVA_OPTS=" -Dfile.encoding=UTF-8 "

兩個solr具有相同的Java屬性(在UI中)。

#12是什么? 意思?

問題可能在哪里?

OS:

  • Ubuntu 14.04

軟件:

  • Tomcat 8.0.43
  • Dspace 6.0
  • Solr 4.10.4

編輯:兩台服務器上的語言環境輸出:

LANG=en_CA.utf8  
LANGUAGE=en_CA:en
LC_CTYPE="en_CA.utf8"
LC_NUMERIC="en_CA.utf8"
LC_TIME="en_CA.utf8"
LC_COLLATE="en_CA.utf8"
LC_MONETARY="en_CA.utf8"
LC_MESSAGES="en_CA.utf8"
LC_PAPER="en_CA.utf8"
LC_NAME="en_CA.utf8"
LC_ADDRESS="en_CA.utf8"
LC_TELEPHONE="en_CA.utf8"
LC_MEASUREMENT="en_CA.utf8"
LC_IDENTIFICATION="en_CA.utf8"
LC_ALL=

謝謝!

問題不在於編碼,而在於DSpace的工作方式。 我必須運行命令:

./dspace filter-media -f 

此命令將從PDF重新生成.txt文件並為文檔重新編制索引。 因此,每次我嘗試使用正確的編碼為文檔建立索引時,它都不會更改任何內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM