簡體   English   中英

如何解析來自RSS供稿的編碼數據?

[英]How to parse encoding data from the rss feed?

我正在解析rss feed。但是我可以解析來自rss feed的編碼數據。如何解析來自rss feed的編碼數據?

這是一項艱巨的任務。 feedparser (Python)做了很多事情來嘗試適當地猜測正確的字符集。 可以在幾個地方提供它-例如XML的標頭和HTTP事務的標頭(覆蓋XML的標頭)。 如果它不存在(或者完全無效,這很普遍),則可以依靠統計猜測。 最后一種技術-嘗試將其轉換為UTF-8,如果失敗,則將其從ISO-8859-1轉換為UTF-8,然后重試。 祝好運!

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM