Groupby 基於先前值的條件（Pandas Python）

Question

例如，我有這個樣本 dataframe

    Depth  Fluid

0   235.5  nan
1   236    water
2   236.5  water
3   237    nan
4   237.5  water
5   238    water

現在我想獲取樣本數據就像這樣

    Min_Depth  Max_Depth  Fluid

0   236        236.5      water
1   237.5      238        water

我已經閱讀了pandas groupby和shift方法，邏輯是如果先前的值仍然相同（水）然后將其分組，並使用min和max來獲取Depth ，但我不確定我是否可以構建代碼喜歡我想要的。 我是 Python 的新手，如果有人可以幫助我編寫代碼，我將不勝感激。 謝謝！

Answer 1

你可以用cumsum檢查

x = df.Fluid.ne('water')
out = df[~x].groupby([x.cumsum(),df.Fluid]).agg(max_dp= ('Depth','max'),
                                                min_dp= ('Depth','min')).reset_index(level=1)
out
Out[202]: 
       Fluid  max_dp  min_dp
Fluid                       
1      water   236.5   236.0
2      water   238.0   237.5

Answer 2

另一種可能的解決方案，基於pandas.unstack ：

(df.dropna()
 .assign(Fluid = lambda x: sorted(list(range(len(x)//2)) * 2))
 .set_index(['Fluid', ['minD', 'maxD'] * 2])
 .unstack()
 .droplevel(0, axis=1)
 .reset_index()
 .assign(Fluid = 'water'))

Output：

   Fluid   maxD   minD
0  water  236.5  236.0
1  water  238.0  237.5

Groupby 基於先前值的條件（Pandas Python）

問題描述

2 個解決方案

解決方案1
1 已采納 2022-09-16 03:02:18

解決方案2
0 2022-09-22 23:59:51

Groupby 基於先前值的條件（Pandas Python）

問題描述

2 個解決方案

解決方案1 1 已采納 2022-09-16 03:02:18

解決方案2 0 2022-09-22 23:59:51

解決方案1
1 已采納 2022-09-16 03:02:18

解決方案2
0 2022-09-22 23:59:51