[英]How to replace a string that is a part of a dataframe with a list in pandas?
我是编码的初学者,因为这是一个非常简单的问题,我知道肯定有答案。 然而,我已经搜索了大约半个小时,在谷歌中输入了无数的查询,一切都在我脑海中浮现。
假设我有一个 dataframe 列“姓名”、“爱好”和 2 个人,所以 2 行。 目前,我的爱好是“hobby1,hobby2”形式的字符串。 我想把它改成 ["hobby1", "hobby2"]
hobbies_as_string = df.iloc[0, 2]
hobbies_as_list = hobbies_as_string.split(',')
df.iloc[0, -2] = hobbies_as_list
但是,这会导致错误,ValueError: Must have equal len keys and value when setting with an iterable。 我不明白为什么如果我得到 hobbies_as_string 作为副本,我可以将 hobbies 列分配为列表没有问题。 我还可以将 df.iloc[0,-2] 分配为字符串,例如“Hey”,效果很好。 我猜它与ValueError有关。 为什么 pandas 不让我将其分配为列表?
非常感谢您的帮助和解释。
您是否希望apply
split
行应用于列表中的每个值?
import pandas as pd
df = pd.DataFrame({'Name' : ['John', 'Kate'],
'Hobbies' : ["Hobby1, Hobby2", "Hobby2, Hobby3"]})
df['Hobbies'] = df['Hobbies'].apply(lambda x: x.split(','))
df
或者如果你不是一个大的 lambda exer,那么你可以在整个列上做str.split()
,这更容易:
import pandas as pd
df = pd.DataFrame({'Name' : ['John', 'Kate'],
'Hobbies' : ["Hobby1, Hobby2", "Hobby2, Hobby3"]})
df['Hobbies'] = df['Hobbies'].str.split(",")
df
Output:
Name Hobbies
0 John [Hobby1, Hobby2]
1 Kate [Hobby2, Hobby3]
另一种方法
df=pd.DataFrame({'hobbiesStrings':['"hobby1, hobby2"']})
df
将,whitespace替换为","
并将hobbiesStrings
值放入列表中
x=df.hobbiesStrings.str.replace('((?<=)(\,\s+)+)','","').values.tolist()
x
在这里我使用正则表达式基本上我用","
替换comma \,
然后是空格\s
使用df.assign重写列
df=df.assign(hobbies_stringsnes=[x])
连在一起
df=df.assign(hobbies_stringsnes=[df.hobbiesStrings.str.replace('((\,\s))','","').values.tolist()])
df
Output
使用“at”方法将值替换为列表
import pandas as pd
# create a dataframe
df = pd.DataFrame(data={'Name': ['Stinky', 'Lou'],
'Hobbies': ['Shooting Sports', 'Poker']})
# replace Lous hobby of poker with a list of degen hobbies with the at method
df.at[1, 'Hobbies'] = ['Poker', 'Ponies', 'Dice']
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.