簡體 English 中英

SERE0014：非法的HTML字符-解析控制字符時出現十進制129異常

[英]SERE0014: Illegal HTML character - decimal 129 exception while parsing control characters

原文 2018-09-04 12:13:48 6 1 java/ character-encoding/ html-parsing/ transformer/ illegal-characters

最近，在一個案例中，我發現了一個帶有控制字符的字符串，我們將該字符串保存到數據庫中，並嘗試從中創建xml和HTML文件。 它已正確保存在數據庫中，並在不同位置顯示如下。
1）查詢數據庫時，名稱顯示為 。
2）當我將其復制到記事本++（UTF-8編碼）時，顯示為 。
3）在Eclipse IDE中，調試模式將其顯示為與DB相同。
4）在HTML頁面（apache / tomcat）中的表記錄中，以及在控制台中的sysout輸出中顯示為簡單 ，我認為這是更可取的預期輸出。

我能夠創建帶有垃圾字符的XML文件，但是當我嘗試使用具有UTF-8編碼的javax TransformerFactory創建HTML時。 transformer.transform(source, result);
引發異常“ HTML字符非法-十進制129” 。
我知道字符串中存在一些UTF-8不支持的控制字符，因此解析器將拋出此異常。
我在這里找到了它的引用： https : //www.fileformat.info/info/unicode/char/0081/index.htm

為了解決這個問題，我嘗試了很多事情，但是結果接近預期的一件事是在將字符串交給解析器之前將其手動解析，然后將其更改為UTF-8字符串，如下所示：
String str = new String(nodeValue.getBytes(StandardCharsets.US_ASCII), StandardCharsets.UTF_8); str = str.replaceAll("[^\\p{ASCII}]", "");

這可以在一定程度上解決問題，但是我認為解析整個內容並不是從String中刪除1個控制字符的最佳方法，這也可以轉換名稱 至 這不是可取的，我實際上希望它沒有任何變化。

有沒有標准的方法可以做到這一點，以便我們可以在解析的HTML中獲得正確的輸出？

sysout和apache tomcat的HTML頁面如何正確顯示它？ 他們會明確處理嗎？

1 個解決方案

 不管您如何在文檔中將其表示為字符，在HTML中都是非法的。

似乎有人在測試您。 GUI不應允許它，或者您不得不忍受無法以HTML形式顯示它。 如果只需要顯示它，則可以將其轉換為圖像。 不幸的是，[HOP]沒有相應的控制畫面。

非法字符（CTRL-CHAR，代碼 0） - 解析異常

[英]Illegal character (CTRL-CHAR, code 0) - Parsing Exception

IWAB0014E創建Web服務時發生意外異常

[英]IWAB0014E Unexpected exception occurred while creating web service

獲取java.lang.IllegalArgumentException：非法模式字符'o'？在解析java.text.SimpleDateFormat時

[英]getting java.lang.IllegalArgumentException: Illegal pattern character 'o'? while parsing java.text.SimpleDateFormat

XML解析錯誤（SOAP）：非法字符

[英]XML parsing error (SOAP): Illegal character

Groovy日期解析— X是非法的模式字符

[英]Groovy Date Parsing — X is an illegal pattern character

迄今為止的字符串解析：非法模式字符“T”。

[英]Parsing string to date: Illegal pattern character 'T'.

格式化參數“” java.lang.IllegalArgumentException時發生異常：非法模式字符“ T”

[英]Exception while formatting the parameter“ ”java.lang.IllegalArgumentException: Illegal pattern character 'T'

為什么不能將這種非法字符異常解析為類型？

[英]Why is this Illegal Character Exception not being resolved to a type?

路徑中索引65處異常的字符異常[java]

[英]Illegal character in path at index 65 exception [ java ]

在java中存儲和解析HTML時特殊字符和符號的問題

[英]Issues with special characters and symbols while storing and parsing HTML in java

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 非法字符（CTRL-CHAR，代碼 0） - 解析異常 IWAB0014E創建Web服務時發生意外異常獲取java.lang.IllegalArgumentException：非法模式字符'o'？在解析java.text.SimpleDateFormat時 XML解析錯誤（SOAP）：非法字符 Groovy日期解析— X是非法的模式字符迄今為止的字符串解析：非法模式字符“T”。格式化參數“” java.lang.IllegalArgumentException時發生異常：非法模式字符“ T” 為什么不能將這種非法字符異常解析為類型？路徑中索引65處異常的字符異常[java] 在java中存儲和解析HTML時特殊字符和符號的問題

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM