大熊貓，分組和聚合

Question

我對數據框進行了分組：

rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt','column'])['concentration'].plot(marker = 'o', rot=30)

並獲得以下輸出：

sample_name  pH   salt  column
sma_initial  5.7  50    5         Axes(0.125,0.125;0.775x0.775)
                        6         Axes(0.125,0.125;0.775x0.775)
                  100   7         Axes(0.125,0.125;0.775x0.775)
                        8         Axes(0.125,0.125;0.775x0.775)
                  200   9         Axes(0.125,0.125;0.775x0.775)
                        10        Axes(0.125,0.125;0.775x0.775)
                  400   11        Axes(0.125,0.125;0.775x0.775)
                        12        Axes(0.125,0.125;0.775x0.775)

在此處輸入圖片說明

我想取每個pH和鹽濃度內的平均值。 這些柱只是兩次測量的同一樣品。 如果我使用aggregate(np.mean) ，則計算一列所有數據點的平均值。

該圖可能會突出顯示我想取平均值的數據點（我想沿行取平均值）：

rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt'])['concentration'].plot(marker = 'o', rot=30)

Answer 1

好的，我找到了答案：

grp_initial = rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt']).concentration

for grp, val in grp_initial:
    print(val.groupby(level='row').aggregate(np.mean))

作品

大熊貓，分組和聚合

問題描述

1 個解決方案

解決方案1
0 2014-09-01 09:33:34

大熊貓，分組和聚合

問題描述

1 個解決方案

解決方案1 0 2014-09-01 09:33:34

解決方案1
0 2014-09-01 09:33:34