簡體   English   中英

大熊貓,分組和聚合

[英]pandas, grouping and aggregating

我對數據框進行了分組:

rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt','column'])['concentration'].plot(marker = 'o', rot=30)

並獲得以下輸出:

sample_name  pH   salt  column
sma_initial  5.7  50    5         Axes(0.125,0.125;0.775x0.775)
                        6         Axes(0.125,0.125;0.775x0.775)
                  100   7         Axes(0.125,0.125;0.775x0.775)
                        8         Axes(0.125,0.125;0.775x0.775)
                  200   9         Axes(0.125,0.125;0.775x0.775)
                        10        Axes(0.125,0.125;0.775x0.775)
                  400   11        Axes(0.125,0.125;0.775x0.775)
                        12        Axes(0.125,0.125;0.775x0.775)

在此處輸入圖片說明

我想取每個pH和鹽濃度內的平均值。 這些柱只是兩次測量的同一樣品。 如果我使用aggregate(np.mean) ,則計算一列所有數據點的平均值。

該圖可能會突出顯示我想取平均值的數據點(我想沿行取平均值):

rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt'])['concentration'].plot(marker = 'o', rot=30)

好的,我找到了答案:

grp_initial = rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt']).concentration

for grp, val in grp_initial:
    print(val.groupby(level='row').aggregate(np.mean))

作品

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM