[英]java sax parse not well formed xml
我正在使用Java和SAX從搜索引擎實現RSS搜索功能。 但是,某些搜索結果的格式不正確,即某些條目的<title>
標記的正文包含&
字符而不是&
等等(例如,像Starsky & Hutch
)。
解析RSS時,我得到org.apache.harmony.xml.ExpatParser&ParseException
,導致整個搜索中斷並且什么也不返回。
我希望解析器能夠解決這些錯誤,就像Firefox的RSS閱讀器一樣。 解決此問題並解析RSS feed的可能性是什么?
SAX實現通常旨在檢測錯誤和引發異常,並且沒有解決此問題的標准方法。 我能想到的最合理的方法是在流送至SAX之前嘗試修補錯誤(例如雜散和字符)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.