[英]Pandas resample to return NaN when all values are NaN
我正在使用重新采樣將我的數據匯總到每小時塊中。 當該小時的所有輸入數據均為 NaN 時,resample 將生成 0 而不是 NaN 的值。
我的原始數據是這樣的:
infile
Out[206]:
Date_time Rainfall
0 2019-02-02 14:18:00 NaN
1 2019-02-02 14:20:00 NaN
2 2019-02-02 14:25:00 NaN
3 2019-02-02 14:30:00 NaN
4 2019-02-02 14:35:00 NaN
5 2019-02-02 14:40:00 NaN
6 2019-02-02 14:45:00 NaN
7 2019-02-02 14:50:00 NaN
8 2019-02-02 14:55:00 NaN
9 2019-02-02 15:00:00 0.0
10 2019-02-02 15:05:00 NaN
11 2019-02-02 15:10:00 NaN
12 2019-02-02 15:15:00 NaN
13 2019-02-02 15:20:00 NaN
14 2019-02-02 15:25:00 NaN
15 2019-02-02 15:30:00 NaN
16 2019-02-02 15:35:00 NaN
17 2019-02-02 15:40:00 NaN
18 2019-02-02 15:45:00 NaN
19 2019-02-02 15:50:00 NaN
20 2019-02-02 15:55:00 NaN
我希望我的 output 是這樣的:
Date_time Rainfall
0 2019-02-02 14:18:00 NaN
1 2019-02-02 15:00:00 0.0
但相反,我得到了這個:
output[['Date_time', 'Rainfall']]
Out[208]:
Date_time Rainfall
0 2019-02-02 14:18:00 0.0
1 2019-02-02 15:00:00 0.0
這是我用來到達那里的代碼 - 它比本示例所需的要復雜一些,因為我使用它來遍歷其他點的列名列表:
def sum_calc(col_name):
col = infile[['Date_time', col_name]].copy()
col.columns = ('A', 'B')
col = col.resample('H', on='A').B.sum().reset_index(drop=True)
output[col_name] = col.copy()
sum_calc('Rainfall')
關於如何使它工作的任何線索? 我在網上看了看,如果組中的任何值是 NaN,所有選項似乎都會產生 NaN,而不是像我追求的所有值。
嘗試:
>>> df.resample("H", on="Date_time")["Rainfall"].agg(pd.Series.sum, min_count=1)
Date_time
2021-12-17 14:00:00 NaN
2021-12-17 15:00:00 0.0
Freq: H, Name: Rainfall, dtype: float64
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.