根据pandas中的第三列保留两列之间的值

Question

我有三列，A，B和C.我想创建第四列D，其中包含A或B的值，基于C的值。例如：

   A   B   C   D 
0  1   2   1   1
1  2   3   0   3
2  3   4   0   4
3  4   5   1   4

在上面的例子中，如果C的值为1，则列D取A列的值，如果C的值为0，则取列B的值。在Pandas中有优雅的方法吗？ 谢谢您的帮助。

Answer 1

使用numpy.where ：

In [20]: df
Out[20]:
   A  B  C
0  1  2  1
1  2  3  0
2  3  4  0
3  4  5  1

In [21]: df['D'] = np.where(df.C, df.A, df.B)

In [22]: df
Out[22]:
   A  B  C  D
0  1  2  1  1
1  2  3  0  3
2  3  4  0  4
3  4  5  1  4

Answer 2

pandas
考虑到OP的要求

在熊猫中有优雅的方式吗？

我对优雅的看法
和惯用的纯pandas
assign + pd.Series.where

df.assign(D=df.A.where(df.C, df.B))

   A  B  C  D
0  1  2  1  1
1  2  3  0  3
2  3  4  0  4
3  4  5  1  4

回应评论

你如何修改pandas的答案，而不是0，在C列中你有A，B？

df.assign(D=df.lookup(df.index, df.C))

   A  B  C  D
0  1  2  A  1
1  2  3  B  3
2  3  4  B  4
3  4  5  A  4

根据pandas中的第三列保留两列之间的值

问题描述

2 个解决方案

解决方案1
8 2017-04-05 10:47:53

解决方案2
2 已采纳 2017-04-05 10:50:46

根据pandas中的第三列保留两列之间的值

问题描述

2 个解决方案

解决方案1 8 2017-04-05 10:47:53

解决方案2 2 已采纳 2017-04-05 10:50:46

解决方案1
8 2017-04-05 10:47:53

解决方案2
2 已采纳 2017-04-05 10:50:46