簡體   English   中英

如何擺脫python字符串中的怪異字符?

[英]How to get rid of weird characters in python string?

我的行包含一些討厭的控制字符:

在此處輸入圖片說明

當我嘗試讀取文件然后執行str.replace() ,這些控制字符沒有被替換。 我已經嘗試過了,但它仍然存在。

with io.open('infile', 'r', encoding='utf8') as fin:
    for line in fin:
        line = line.replace(u'\u0094', '"').replace(u'\u0093', '"').replace(u'\u0092', "'").replace(u'\u0096', '"').replace(u'\u0084', '"')

如何獲得這些字符串替換? 有沒有一種規范的方法可以替換這些字符串(它們看起來像引號/各種空白)?

這些字符到底是什么? 什么是u'\„'

上次遇到該問題時,是因為我從ascii范圍以外獲取字符,所以邊界錯誤。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM