繁体   English   中英

如何对熊猫数据框进行分组并对另一列中的值求和

[英]How to groupby pandas dataframe and sum values in another column

我有一个包含 3 列(CHAR、VALUE 和 WEIGHT)的 Pandas 数据框。

  • CHAR 列包含重复值,我需要将这些值分组 ['A'、'A'、'A'、'B'、'B'、'C']。

  • VALUE 列对于每个唯一的 CHAR [10, 10, 10, 15, 15, 20] 都有一个唯一的值。

  • WEIGHT 列有各种值 [1, 2, 1, 4, 4, 6]。

考虑我的初始数据框的示例:

在此处输入图片说明

我需要创建一个包含 3 列的新数据框。

  • CHAR 不会有任何重复
  • T_VALUE(总价值),它将包含此 CHAR 的值及其所有权重的总和
  • T_WEIGHT(总重量),它将具有此 CHAR 的权重之和

结果如下所示:

在此处输入图片说明

我将不胜感激任何帮助。

你可以使用+=代替:

newDF = df.groupby(['CHAR', 'VALUE'], as_index=False)['WEIGHT'].sum()
newDF['VALUE'] += newDF['WEIGHT']

我实际上能够回答我自己的问题。 这是解决方案:

d = {'CHAR': ['A', 'A', 'A', 'B', 'B', 'C'],
     'VALUE': [10, 10, 10, 15, 15, 20], 
     'WEIGHT':  [1, 2, 1, 4, 4, 6]}
df = pandas.DataFrame(data=d)

newDF = df.groupby(['CHAR', 'VALUE'], as_index=False)['WEIGHT'].sum()
newDF['VALUE'] = newDF['VALUE'] + newDF['WEIGHT']

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM