從計算值中排除列

Question

我是圖書館的新手，正在嘗試弄清楚如何將列添加到 pivot 表中，其中包含過去三個月交易數據的行數據的平均值和標准差。

下面是設置 pivot 表的代碼：

previousThreeMonths = [prev_month_for_analysis, prev_month2_for_analysis, prev_month3_for_analysis]
dfPreviousThreeMonths = df[df['Month'].isin(previousThreeMonths)]

ptHistoricalConsumption = dfPreviousThreeMonths.pivot_table(dfPreviousThreeMonths,
                                                            index=['Customer Part #'],
                                                            columns=['Month'],
                                                            aggfunc={'Qty Shp':np.sum}
                                                            )

ptHistoricalConsumption['Mean'] = ptHistoricalConsumption.mean(numeric_only=True, axis=1)
ptHistoricalConsumption['Std Dev'] = ptHistoricalConsumption.std(numeric_only=True, axis=1)
ptHistoricalConsumption

生成的 pivot 表如下所示：

問題是標准差列在其計算中包含了平均值，而我只希望它使用前三個月的原始數據。 例如，部件號 2225 的Std Dev偏差應該是 11.269，而不是 9.2。

我確信有更好的方法可以做到這一點，我只是錯過了一些東西。

Answer 1

一種方法是在調用.std()之前暫時刪除Mean列：

ptHistoricalConsumption['Std Dev'] = ptHistoricalConsumption.drop('Mean', axis=1).std(numeric_only=True, axis=1)

這不會將其永久刪除，它只會將其從饋送到.std()的副本中刪除。

從計算值中排除列

問題描述

1 個解決方案

解決方案1
0 2021-11-20 15:30:32

從計算值中排除列

問題描述

1 個解決方案

解決方案1 0 2021-11-20 15:30:32

解決方案1
0 2021-11-20 15:30:32