[英]pandas, grouping and aggregating
我對數據框進行了分組:
rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt','column'])['concentration'].plot(marker = 'o', rot=30)
並獲得以下輸出:
sample_name pH salt column
sma_initial 5.7 50 5 Axes(0.125,0.125;0.775x0.775)
6 Axes(0.125,0.125;0.775x0.775)
100 7 Axes(0.125,0.125;0.775x0.775)
8 Axes(0.125,0.125;0.775x0.775)
200 9 Axes(0.125,0.125;0.775x0.775)
10 Axes(0.125,0.125;0.775x0.775)
400 11 Axes(0.125,0.125;0.775x0.775)
12 Axes(0.125,0.125;0.775x0.775)
我想取每個pH和鹽濃度內的平均值。 這些柱只是兩次測量的同一樣品。 如果我使用aggregate(np.mean)
,則計算一列所有數據點的平均值。
該圖可能會突出顯示我想取平均值的數據點(我想沿行取平均值):
rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt'])['concentration'].plot(marker = 'o', rot=30)
好的,我找到了答案:
grp_initial = rwp_initial.df.loc[rwp_initial.df.sample_name=='sma_initial'].groupby(by=['sample_name','pH','salt']).concentration
for grp, val in grp_initial:
print(val.groupby(level='row').aggregate(np.mean))
作品
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.