Pandas 系列 - groupby 並取最近的非空累積

Question

我有一個 dataframe，其中包含Category列（我們將按其分組）和Value列。 我想添加一個新列LastCleanValue ，它顯示該組的最新非 null 值。 如果組中還沒有任何非空值，我們就取 null。例如：

df = pd.DataFrame({'Category':['a','a','a','b','b','a','a','b','a','a','b'],
                   'Value':[np.nan, np.nan, 34, 40, 42, 25, np.nan, np.nan, 31, 33, np.nan]})

而 function 應該添加一個新列：

|    | Category   |   Value |   LastCleanValue |
|---:|:-----------|--------:|-----------------:|
|  0 | a          |     nan |              nan |
|  1 | a          |     nan |              nan |
|  2 | a          |      34 |               34 |
|  3 | b          |      40 |               40 |
|  4 | b          |      42 |               42 |
|  5 | a          |      25 |               25 |
|  6 | a          |     nan |               25 |
|  7 | b          |     nan |               42 |
|  8 | a          |      31 |               31 |
|  9 | a          |      33 |               33 |
| 10 | b          |     nan |               42 |

我如何在 Pandas 中執行此操作？ 我正在嘗試類似df.groupby('Category')['Value'].dropna().last()

Answer 1

這更像是ffill

df['new'] = df.groupby('Category')['Value'].ffill()
Out[430]: 
0      NaN
1      NaN
2     34.0
3     40.0
4     42.0
5     25.0
6     25.0
7     42.0
8     31.0
9     33.0
10    42.0
Name: Value, dtype: float64

Pandas 系列 - groupby 並取最近的非空累積

問題描述

1 個解決方案

解決方案1
1 已采納 2020-12-06 23:50:47

Pandas 系列 - groupby 並取最近的非空累積

問題描述

1 個解決方案

解決方案1 1 已采納 2020-12-06 23:50:47

解決方案1
1 已采納 2020-12-06 23:50:47