对于一列的所有唯一“单词”，从另一列中找到唯一的单元格，然后在python中平均另一列的对应值

Question

假设我有一个包含以下数据的 FILE.CSV

可乐	列	寒冷的
FCPP	2019年	5
FCPP	2020年	20
FCPP	2020年	10
PSGS	2020年	20
PSGS	2019年	30
PSGS	2019年	20

我想从 colA 中获取唯一名称，然后从 colB 中找出对应的唯一年份，然后对 colD 的值求平均值。 我的输出应该如下所示

可乐	列	寒冷的
FCPP	2019年	5
FCPP	2020年	15
PSGS	2019年	25
PSGS	2020年	20

我知道如何使用 df.unique() 在 Pandas 中找到唯一值，我可以使用

df.groupby(['colA'])['colD'].mean()

但不确定如何在命令中适应 colB。

Answer 1

简单groupby

out = df.groupby(['colA','colB'],as_index=False).mean()
Out[114]: 
   colA  colB  colD
0  FCPP  2019     5
1  FCPP  2020    15
2  PSGS  2019    25
3  PSGS  2020    20

对于一列的所有唯一“单词”，从另一列中找到唯一的单元格，然后在python中平均另一列的对应值

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-07-19 15:29:30

对于一列的所有唯一“单词”，从另一列中找到唯一的单元格，然后在python中平均另一列的对应值

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-07-19 15:29:30

解决方案1
1 已采纳 2021-07-19 15:29:30