簡體   English   中英

java sax解析格式不正確的xml

[英]java sax parse not well formed xml

我正在使用Java和SAX從搜索引擎實現RSS搜索功能。 但是,某些搜索結果的格式不正確,即某些條目的<title>標記的正文包含&字符而不是&amp; 等等(例如,像Starsky & Hutch )。

解析RSS時,我得到org.apache.harmony.xml.ExpatParser&ParseException ,導致整個搜索中斷並且什么也不返回。

我希望解析器能夠解決這些錯誤,就像Firefox的RSS閱讀器一樣。 解決此問題並解析RSS feed的可能性是什么?

SAX實現通常旨在檢測錯誤和引發異常,並且沒有解決此問題的標准方法。 我能想到的最合理的方法是在流送至SAX之前嘗試修補錯誤(例如雜散和字符)。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM