簡體   English   中英

替換熊貓數據框中的多個字符

[英]replace mutliple characters in pandas dataframe

試圖刪除一個字符

我從網上抓取了這些數據,並想刪除第二列中的所有非整數字符,以便我可以對其進行數學運算。

有沒有另一種方法可以刪除一行中的所有括號和逗號

您可以使用帶有字符類[(),] str.replace去除括號和逗號。 然后,當您想將此文本列用作數字數據時,稍后使用to_numeric()

df['pop'] = df['pop'].str.replace('[(),]+', '', regex=True)

我也建議你這樣做:它為每個元素創建一個新列:

df['pop1'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(1))
df['pop2'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(2))
df['pop3'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(3))

它表明您在“pop”中始終具有相同的 nbr 元素。 使用相同的技術,您還可以在彈出列中創建整數列表。 取決於你想如何工作。 像這樣例如:

pop4 = []
for i in df['pop']:
    newstr = ''.join((ch if ch in '0123456789.-e'else ' ') for ch in i)
    listOfNumbers = [float(x) for x in newstr.split()]    
    pop4.append(listOfNumbers)

df['pop4']=pop4

在此處輸入圖片說明

OFC你可以int或float ...

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM