使用 Python 計算值組的標准偏差

Question

我的數據看起來類似於：

index name number difference
0     AAA  10     0
1     AAA  20     10
2     BBB  1      0
3     BBB  2      1
4     CCC  5      0
5     CCC  10     5
6     CCC  10.5   0.5

我需要根據名稱組計算差異列的標准偏差。

我試過了

data[['difference']].groupby(['name']).agg(['mean', 'std'])

和

data["std"]=(data['difference'].groupby('name').std())

但兩者都為傳遞給groupby()的變量提供了 KeyError 。 我試圖解決它：

data.columns = data.columns.str.strip()

但錯誤仍然存在。

提前致謝。

Answer 1

您可以先在完整數據框上使用groupby(['name']) ，然后僅將 agg 應用於感興趣的列：

data = pd.DataFrame({'name':['AAA','AAA','BBB','BBB','CCC','CCC','CCC'],
                    'number':[10,20,1,2,5,10,10.5],
                    'difference':[0,10,0,1,0,5,0.5]})
data.groupby(['name'])['difference'].agg(['mean', 'std'])

使用 Python 計算值組的標准偏差

問題描述

1 個解決方案

解決方案1
2 已采納 2022-01-03 17:24:06

使用 Python 計算值組的標准偏差

問題描述

1 個解決方案

解決方案1 2 已采納 2022-01-03 17:24:06

解決方案1
2 已采納 2022-01-03 17:24:06