![](/img/trans.png)
[英]Karate HTML parsing throwing SaxException when document begins with lower-case <!doctype
[英]SAXException when parsing the character “°”
我在基於SAXParser
的RSS feed解析器上遇到了一些麻煩。 我擴展了DefaultHandler
類,直到今天一切正常。 我現在遇到麻煩了,因為供稿文件包含以下行:
<description>°</description>
所以我得到一個異常描述如下:
org.apache.harmony.xml.ExpatParser$ParseException: At line 102, column 13: not well-formed (invalid token)
我該如何解決這種情況? 我應該怎么做才能避免這種異常?
這里的文章建議您需要在輸入源上正確設置編碼。 本文的摘錄提供了以下解決方案,使用了適合您數據的編碼(此處提供了兩個示例):
InputSource inputSource = new InputSource(is);
//inputSource.setEncoding("iso-8859-1");
inputSource.setEncoding("utf-8");
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.