[英]'ascii' codec can't encode character u'\u2013'
我正在使用Wikipedia.py從Wikipedia部分中獲取信息。 這樣做時,我在以下Python代碼中編碼時遇到問題:
for section in data.sections:
info = data.section(section).encode('utf-8')
info = info.encode('string_escape')
print info
數據變量是整個Wikipedia頁面。 每次運行腳本時,都會出現以下錯誤:
'ascii'編解碼器無法編碼字符u'\\ u2013'
您必須首先通過Wikipedia部分的編碼對data.section(section)
解碼。
假設Wikipedia部分的編碼為gbk
,代碼片段如下所示:
for section in data.sections:
# Please check encoding in decode() first.
info = data.section(section).decode('gbk').encode('utf-8')
info = info.encode('string_escape')
print info
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.