簡體   English   中英

如何修復python中字符串的編碼錯誤

[英]How can I fix encoding errors in a string in python

我有一個python腳本作為Subversion的預提交鈎子,在提交消息中遇到了UTF-8編碼文本的問題。 例如,如果輸入字符為“å”,則輸出為“?\\ 195?\\ 165”。 用相應的字節值替換那些字符部分的最簡單方法是什么? 正則表達式不起作用,因為我需要對每個元素進行處理並將它們合並回去。

代碼示例:

infoCmd = ["/usr/bin/svnlook", "info", sys.argv[1], "-t", sys.argv[2]]
info = subprocess.Popen(infoCmd, stdout=subprocess.PIPE).communicate()[0]
info = info.replace("?\\195?\\166", "æ")

我在代碼中做同樣的事情,您應該可以使用:

... u_changed_pa​​th = unicode(changed_pa​​th,'utf-8')...

使用上述方法時,我僅遇到換行等字符的問題。 如果您發布一些代碼,可能會有所幫助。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM