簡體   English   中英

python字符串編碼unicode

[英]python string encoding unicode

我正在使用python 2.7,將“ä”等字符轉換為“ ae”時遇到一些問題。

我正在使用以下方法檢索網頁的內容:

req = urllib2.Request(url + str(questionID))
response = urllib2.urlopen(req)
data = response.read()

之后,我正在做一些提取工作,這就是我的問題。

extractedStr = pageContent[start:end] // this string contains the "ä" !
extractedStr = extractedStr.decode("utf8") // here I get the error, tried it with encode aswell
extractedStr = extractedStr.replace(u"ä", "ae")

->'utf8'編解碼器無法解碼位置13的字節0xe4:無效的連續字節

但是:我的簡單試驗工作正常……:

someStr = "geräusch"
someStr = someStr.decode("utf8")
someStr = someStr.replace(u"ä", "ae")

我有種感覺,這與我嘗試使用.decode()函數有關……我在多個位置嘗試過,但沒有成功:(

請改用.decode("latin-1") 那就是您要解碼的內容。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM