簡體   English   中英

從urlopen檢索的XML數據將“ <”和“>”替換為“;”

[英]XML data retrieved from urlopen replaces “<” and “>” with “;”

我從網址檢索數據為:

data = urllib2.urlopen(url).read()

但是,我注意到沒有標簽。 這是因為“ <”和“>”被替換為“;” 字符。 其他一切都完好無損。 所以:

<foo>bar</foo>更改為;foo;bar;/foo;

我該如何解決這個問題,為什么會發生呢?

[編輯]:我找到了解決方法。 顯然,它是將'<'替換為'&lt',將'>'替換為'&gt'。 我想這些標志的簡短形式。 我仍然不知道為什么會這樣。 我猜在webservice / API中有一些錯誤。

我只是跑了這個:

    import urllib2

    url='http://www.google.com'
    data = urllib2.urlopen(url).read()
    print data

而且我有很多<和>,包括最后一行</script></body></html>

您能否發布更多詳細信息,例如您嘗試訪問的url和data值?

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM