如何用 pandas 中的列表替换属于 dataframe 的字符串？

Question

我是编码的初学者，因为这是一个非常简单的问题，我知道肯定有答案。 然而，我已经搜索了大约半个小时，在谷歌中输入了无数的查询，一切都在我脑海中浮现。

假设我有一个 dataframe 列“姓名”、“爱好”和 2 个人，所以 2 行。 目前，我的爱好是“hobby1，hobby2”形式的字符串。 我想把它改成 ["hobby1", "hobby2"]

hobbies_as_string = df.iloc[0, 2]
hobbies_as_list = hobbies_as_string.split(',')
df.iloc[0, -2] = hobbies_as_list

但是，这会导致错误，ValueError: Must have equal len keys and value when setting with an iterable。 我不明白为什么如果我得到 hobbies_as_string 作为副本，我可以将 hobbies 列分配为列表没有问题。 我还可以将 df.iloc[0,-2] 分配为字符串，例如“Hey”，效果很好。 我猜它与ValueError有关。 为什么 pandas 不让我将其分配为列表？

非常感谢您的帮助和解释。

Answer 1

您是否希望apply split行应用于列表中的每个值？

import pandas as pd
df = pd.DataFrame({'Name' : ['John', 'Kate'],
              'Hobbies' : ["Hobby1, Hobby2", "Hobby2, Hobby3"]})
df['Hobbies'] = df['Hobbies'].apply(lambda x: x.split(','))
df

或者如果你不是一个大的 lambda exer，那么你可以在整个列上做str.split() ，这更容易：

import pandas as pd
df = pd.DataFrame({'Name' : ['John', 'Kate'],
              'Hobbies' : ["Hobby1, Hobby2", "Hobby2, Hobby3"]})
df['Hobbies'] = df['Hobbies'].str.split(",")
df

Output：

    Name    Hobbies
0   John    [Hobby1, Hobby2]
1   Kate    [Hobby2, Hobby3]

Answer 2

另一种方法

df=pd.DataFrame({'hobbiesStrings':['"hobby1, hobby2"']})
df

将,whitespace替换为","并将hobbiesStrings值放入列表中

x=df.hobbiesStrings.str.replace('((?<=)(\,\s+)+)','","').values.tolist()

x

在这里我使用正则表达式基本上我用","替换comma \,然后是空格\s

使用df.assign重写列

df=df.assign(hobbies_stringsnes=[x])

连在一起

 df=df.assign(hobbies_stringsnes=[df.hobbiesStrings.str.replace('((\,\s))','","').values.tolist()])
df

Output

Answer 3

使用“at”方法将值替换为列表

import pandas as pd
# create a dataframe
df = pd.DataFrame(data={'Name': ['Stinky', 'Lou'], 
                        'Hobbies': ['Shooting Sports', 'Poker']})
# replace Lous hobby of poker with a list of degen hobbies with the at method
df.at[1, 'Hobbies'] = ['Poker', 'Ponies', 'Dice']

如何用 pandas 中的列表替换属于 dataframe 的字符串？

问题描述

3 个解决方案

解决方案1
0 2020-04-22 04:10:51

解决方案2
0 2020-04-22 04:21:05

解决方案3
0 已采纳 2020-04-22 04:39:18

如何用 pandas 中的列表替换属于 dataframe 的字符串？

问题描述

3 个解决方案

解决方案1 0 2020-04-22 04:10:51

解决方案2 0 2020-04-22 04:21:05

解决方案3 0 已采纳 2020-04-22 04:39:18

解决方案1
0 2020-04-22 04:10:51

解决方案2
0 2020-04-22 04:21:05

解决方案3
0 已采纳 2020-04-22 04:39:18