将列表插入符合列条件的单元格中

Question

考虑df

我想添加另一列"D" ，使D根据"A" ， "B"和"C"条件包含不同的列表

   A  B  C  D
0  3  2  1  [1,0]
1  4  2  3  [1,0]
2  1  4  1  [0,2]
3  2  2  3  [2,0]

我的代码片段如下所示：

df['D'] = 0
df['D'] = df['D'].astype(object)

df.loc[(df['A'] > 1) & (df['B'] > 1), "D"] = [1,0]
df.loc[(df['A'] == 1) , "D"] = [0,2]
df.loc[(df['A'] == 2) & (df['C'] != 0) , "D"] = [2,0]

当我尝试运行此代码时，它会抛出以下错误：

ValueError: Must have equal len keys and value when setting with an iterable

我已按照此处的建议将列转换为Object类型但仍有错误。

我可以推断的是，大熊猫正试图迭代列表的元素，并将每个值分配给单元格，因为我试图将整个列表分配给符合条件的所有单元格。

有什么方法可以用上面的方式分配列表吗？

Answer 1

这是一种愚蠢的方式

cond1 = df.A.gt(1) & df.B.gt(1)
cond2 = df.A.eq(1)
cond3 = df.A.eq(2) & df.C.ne(0)

df['D'] = cond3.map({True: [2, 0]}) \
  .combine_first(cond2.map({True: [0, 2]})) \
  .combine_first(cond1.map({True: [1, 0]})) \

df

Answer 2

另一个解决方案是创建由list填充的Series ，其shape用于生成df length ：

df.loc[(df['A'] > 1) & (df['B'] > 1), "D"] = pd.Series([[1,0]]*df.shape[0])
df.loc[(df['A'] == 1) , "D"] = pd.Series([[0,2]]*df.shape[0])
df.loc[(df['A'] == 2) & (df['C'] != 0) , "D"] = pd.Series([[2,0]]*df.shape[0])
print (df)
   A  B  C       D
0  3  2  1  [1, 0]
1  4  2  3  [1, 0]
2  1  4  1  [0, 2]
3  2  2  3  [2, 0]

Answer 3

免责声明 ：这是我自己的问题。

这两个答案都是由jezrael和piRSquared提供的。

我只是想添加另一种方法，尽管与我在问题中发布的要求略有不同。 您可以将list转换为string ，然后通过类型转换访问它，而不是尝试插入list 。

df.loc[(df['A'] > 1) & (df['B'] > 1), "D"] = '[1,0]'
df.loc[(df['A'] == 1) , "D"] = '[0,2]'
df.loc[(df['A'] == 2) & (df['C'] != 0) , "D"] = '[2,0]'

这可能不适用于每个人的使用，但我绝对可以想到这就足够了。

将列表插入符合列条件的单元格中

问题描述

3 个解决方案

解决方案1
3 2016-09-27 07:05:18

解决方案2
3 已采纳 2016-09-27 08:18:27

解决方案3
1 2016-09-27 08:56:39

将列表插入符合列条件的单元格中

问题描述

3 个解决方案

解决方案1 3 2016-09-27 07:05:18

解决方案2 3 已采纳 2016-09-27 08:18:27

解决方案3 1 2016-09-27 08:56:39

解决方案1
3 2016-09-27 07:05:18

解决方案2
3 已采纳 2016-09-27 08:18:27

解决方案3
1 2016-09-27 08:56:39