[英]How to get rid of weird characters in python string?
我的行包含一些討厭的控制字符:
當我嘗試讀取文件然后執行str.replace()
,這些控制字符沒有被替換。 我已經嘗試過了,但它仍然存在。
with io.open('infile', 'r', encoding='utf8') as fin:
for line in fin:
line = line.replace(u'\u0094', '"').replace(u'\u0093', '"').replace(u'\u0092', "'").replace(u'\u0096', '"').replace(u'\u0084', '"')
如何獲得這些字符串替換? 有沒有一種規范的方法可以替換這些字符串(它們看起來像引號/各種空白)?
這些字符到底是什么? 什么是u'\'
?
上次遇到該問題時,是因為我從ascii范圍以外獲取字符,所以邊界錯誤。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.