簡體   English   中英

如何從列表中刪除非 ascii 字符

[英]How to remove non-ascii characters from a list

我有一個對象類型DataFrame ,其中一些元素是文本元素,一些元素是數字元素。

當我將列轉換為列表時,某些元素具有非 ascii 字符。 有沒有辦法擺脫字符,比如.encode('ascii', 'ignore')但對於列表?

這是我得到的清單:

['Central Park\u202c',
 'Top of the Rock',
 'Statue of Liberty\u202c',
 'Brooklyn Bridge'
]

您可以使用str訪問器:

df.my_column.str.encode('ascii','ignore').str.decode('ascii').tolist()

如果你想對你的列表進行后處理,你可以在它上面應用encode('ascii', 'ignore')

my_list = [
    'Central Park\u202c',
    'Top of the Rock',
    'Statue of Liberty\u202c',
    'Brooklyn Bridge'
]
my_list = [e.encode('ascii', 'ignore').decode("utf-8") for e in my_list]
print(my_list)

輸出應該是:

['Central Park', 'Top of the Rock', 'Statue of Liberty', 'Brooklyn Bridge']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM