[英]replace mutliple characters in pandas dataframe
您可以使用帶有字符類[(),]
str.replace
去除括號和逗號。 然后,當您想將此文本列用作數字數據時,稍后使用to_numeric()
:
df['pop'] = df['pop'].str.replace('[(),]+', '', regex=True)
我也建議你這樣做:它為每個元素創建一個新列:
df['pop1'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(1))
df['pop2'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(2))
df['pop3'] = pd.to_numeric(df['pop'].str.split(r'\D').str.get(3))
它表明您在“pop”中始終具有相同的 nbr 元素。 使用相同的技術,您還可以在彈出列中創建整數列表。 取決於你想如何工作。 像這樣例如:
pop4 = []
for i in df['pop']:
newstr = ''.join((ch if ch in '0123456789.-e'else ' ') for ch in i)
listOfNumbers = [float(x) for x in newstr.split()]
pop4.append(listOfNumbers)
df['pop4']=pop4
OFC你可以int或float ...
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.