在 pandas dataframe 中，如何根据列值过滤行，进行计算并将结果分配给新列？

Question

例如，我有四个人的 dataframe，分为 A 组和 B 组。现在我想过滤掉 B 组，将他们的 Point 分成两半，并将结果分配给名为“Point_new”的新列。

我正在使用如下代码

import pandas as pd

data = {'Name':['Tom', 'Nick', 'Krish', 'Jack'],
        'Group':['A', 'B', 'B', 'A'],
        'Point':[20, 21, 19, 18]}

df = pd.DataFrame(data)

df['Point_new'] = ''

df[df['Group']=='B']['Point_new'] = df[df['Group']=='B']['Point'] / 2

从上述代码的 output 来看，Point_new 列没有填充计算结果。 我想知道为什么会这样，我怎么能正确地做到这一点。

Answer 1

你可以这样做，关键是使用loc -


import pandas as pd

data = {'Name':['Tom', 'Nick', 'Krish', 'Jack'],
        'Group':['A', 'B', 'B', 'A'],
        'Point':[20, 21, 19, 18]}

df = pd.DataFrame(data)


df.loc[(df['Group'] == 'B'),'Point_new'] = df.loc[df['Group']=='B','Point'] / 2


print(df)

    Name Group  Point  Point_new
0    Tom     A     20        NaN
1   Nick     B     21       10.5
2  Krish     B     19        9.5
3   Jack     A     18        NaN

Answer 2

这是因为您试图在 DataFrame 的切片上设置一个值。 在此处查看更多信息： https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

尝试这个：

df.loc[df['Group']=='B', 'Point_new'] = df[df['Group']=='B']['Point'] / 2

产生：

	姓名	团体	观点	Point_new
0	汤姆	一个	20
1	缺口	乙	21	10.5
2	克里什	乙	19	9.5
3	杰克	一个	18

Answer 3

你可以试试：

df = df.assign(Point_New = df[df.Group.eq('B')].Point.div(2))

    Name    Group   Point   Point_New
0   Tom     A       20      NaN
1   Nick    B       21      10.5
2   Krish   B       19      9.5
3   Jack    A       18      NaN

在 pandas dataframe 中，如何根据列值过滤行，进行计算并将结果分配给新列？

问题描述

3 个解决方案

解决方案1
1 已采纳 2021-06-02 04:02:44

解决方案2
1 2021-06-02 04:03:08

解决方案3
0 2021-06-02 04:07:40

在 pandas dataframe 中，如何根据列值过滤行，进行计算并将结果分配给新列？

问题描述

3 个解决方案

解决方案1 1 已采纳 2021-06-02 04:02:44

解决方案2 1 2021-06-02 04:03:08

解决方案3 0 2021-06-02 04:07:40

解决方案1
1 已采纳 2021-06-02 04:02:44

解决方案2
1 2021-06-02 04:03:08

解决方案3
0 2021-06-02 04:07:40