如何根据条件语句重命名列的元素？

Question

在大熊猫中，给出了这个数据框：

df = pd.DataFrame({'l':['a','b','a','c','b','b','a','b','b','a'], 'v':['x','x','y','y','y','x','x','y','x','y'],'n':[1,2,1,2,2,1,2,1,1,2], 'g':[0,0,0,0,0,1,1,1,1,1]})

根据应用于数据框的某些条件语句重命名v的元素的最佳解决方案是什么？

基本上，对于每一行（无论g == 0还是g == 1 ）：

if df.l==a and df.n==1:
    df.v='val1'
elif df.l==a and df.n==2:
    df.v='val2'
elif df.l==b and df.n==1:
    df.v='val3'
elif df.l==b and df.n==2:
    df.v='val4'

Answer 1

你可以简单地用布尔掩码写出来：

df.loc[(df.l == 'a') & (df.n == 1), 'v'] = 'val1'
df.loc[(df.l == 'a') & (df.n == 2), 'v'] = 'val2'
df.loc[(df.l == 'b') & (df.n == 1), 'v'] = 'val3'
df.loc[(df.l == 'b') & (df.n == 2), 'v'] = 'val4'

In [11]: df
Out[11]:
   g  l  n     v
0  0  a  1  val1
1  0  b  2  val4
2  0  a  1  val1
3  0  c  2     y
4  0  b  2  val4
5  1  b  1  val3
6  1  a  2  val2
7  1  b  1  val3
8  1  b  1  val3
9  1  a  2  val2

更一般地说，您可以使用enumerate和itertools.product （类似于Philip的答案）：

from itertools import product
lhs_values, rhs_values = ['a', 'b'], [1, 2]
for i, (lhs, rhs) in enumerate(product(lhs_values, rhs_values)):
    df.loc[(df.l == lhs) & (df.n == rhs), 'v'] = 'val%s' % (i + 1)

也许您只使用唯一的列值：

for i, (lhs, rhs) in enumerate(product(df.l.unique(), df.n.unique())):
    df.loc[(df.l == lhs) & (df.n == rhs), 'v'] = 'val%s' % (i + 1)

In [21]: df
Out[21]:
   g  l  n     v
0  0  a  1  val1
1  0  b  2  val4
2  0  a  1  val1
3  0  c  2  val6
4  0  b  2  val4
5  1  b  1  val3
6  1  a  2  val2
7  1  b  1  val3
8  1  b  1  val3
9  1  a  2  val2

Answer 2

我不确定你是只是给出一个示例DataFrame或者这是你的实际DataFrame ，但你的条件是笛卡尔积，你可以使用itertools构建并在左右两侧循环，以及该对的替换。

from itertools import product

lhs_values = 'a', 'b'
rhs_values = 1, 2
rep_values = ['val%d' % d for d in range(1, 5)]

lhs_rhs = list(product(lhs_values, rhs_values))
it = zip(*(zip(*lhs_rhs) + [tuple(rep_values)]))

for lhs, rhs, rep in it:
    df.v[(df.l == lhs) & (df.n == rhs)] = rep

Answer 3

使用map的不同方法：

value_map = {
             ('a', 1): 'val1',
             ('a', 2): 'val2',
             ('b', 1): 'val3',
             ('b', 2): 'val4'
            }

df.v = map(value_map.get, zip(df.l, df.n))

编辑：Phillip Cloud评论之后的另一种选择：如果你想保留原始的df.v值，以防词典中没有匹配，你可以这样做：

df.v = map(lambda x, y, z: value_map.get((x, y), z), df.l, df.n, df.v)

如何根据条件语句重命名列的元素？

问题描述

3 个解决方案

解决方案1
4 已采纳 2013-09-02 22:46:51

解决方案2
4 2013-09-02 22:50:19

解决方案3
3 2013-09-02 22:57:07

如何根据条件语句重命名列的元素？

问题描述

3 个解决方案

解决方案1 4 已采纳 2013-09-02 22:46:51

解决方案2 4 2013-09-02 22:50:19

解决方案3 3 2013-09-02 22:57:07

解决方案1
4 已采纳 2013-09-02 22:46:51

解决方案2
4 2013-09-02 22:50:19

解决方案3
3 2013-09-02 22:57:07