[英]How to remove non-ascii characters from a list
我有一個對象類型DataFrame
,其中一些元素是文本元素,一些元素是數字元素。
當我將列轉換為列表時,某些元素具有非 ascii 字符。 有沒有辦法擺脫字符,比如.encode('ascii', 'ignore')
但對於列表?
這是我得到的清單:
['Central Park\u202c',
'Top of the Rock',
'Statue of Liberty\u202c',
'Brooklyn Bridge'
]
您可以使用str
訪問器:
df.my_column.str.encode('ascii','ignore').str.decode('ascii').tolist()
如果你想對你的列表進行后處理,你可以在它上面應用encode('ascii', 'ignore')
:
my_list = [
'Central Park\u202c',
'Top of the Rock',
'Statue of Liberty\u202c',
'Brooklyn Bridge'
]
my_list = [e.encode('ascii', 'ignore').decode("utf-8") for e in my_list]
print(my_list)
輸出應該是:
['Central Park', 'Top of the Rock', 'Statue of Liberty', 'Brooklyn Bridge']
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.