繁体   English   中英

使用 Python 计算值组的标准偏差

[英]Calculate standard deviation for groups of values using Python

我的数据看起来类似于:

index name number difference
0     AAA  10     0
1     AAA  20     10
2     BBB  1      0
3     BBB  2      1
4     CCC  5      0
5     CCC  10     5
6     CCC  10.5   0.5

我需要根据名称组计算差异列的标准偏差。

我试过了

data[['difference']].groupby(['name']).agg(['mean', 'std'])

data["std"]=(data['difference'].groupby('name').std())

但两者都为传递给groupby()的变量提供了 KeyError 。 我试图解决它:

data.columns = data.columns.str.strip()

但错误仍然存在。

提前致谢。

您可以先在完整数据框上使用groupby(['name']) ,然后仅将 agg 应用于感兴趣的列:

data = pd.DataFrame({'name':['AAA','AAA','BBB','BBB','CCC','CCC','CCC'],
                    'number':[10,20,1,2,5,10,10.5],
                    'difference':[0,10,0,1,0,5,0.5]})
data.groupby(['name'])['difference'].agg(['mean', 'std'])

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM