簡體   English   中英

Pandas 填充先前日期的連續空日期值 + 固定天數

[英]Pandas fill consecutive null date values from previous dates + a constant number of days

我有一個包含數據列的數據框

Comp_date
0 2020-04-24
1        NaT
2        NaT
3        NaT
4 2020-08-06
5        NaT
6        NaT
7        NaT
8 2020-08-22
9        NaT

我試圖用上一個日期的值填充空值 + 添加一個恆定的天數 (10)。 但我無法這樣做。 我嘗試了以下

df['Comp_date']=df['Comp_date'].fillna((df['Comp_date'].shift()+pd.to_timedelta(10, unit='D')), inplace=True)

什么也沒發生,我得到了相同的結果。 有什么幫助嗎? 預期結果

    Comp_date
0   2020-04-24
1   2020-05-04
2   2020-05-14
3   2020-05-24
4   2020-08-06
5   2020-08-16
6   2020-08-26
7   2020-09-05
8   2020-08-22
9   2020-09-01

我不清楚您的問題,但這會為上次觀察到的Comp_date增加一個恆定的天數。

constant_number_of_days = 2
df2 = df['Comp_date'].ffill().to_frame()
df2.loc[df['Comp_date'].isnull(), 'Comp_date'] += pd.Timedelta(days=constant_number_of_days)
>>> df2
   Comp_date
0 2020-04-24
1 2020-04-26
2 2020-04-26
3 2020-04-26
4 2020-08-06
5 2020-08-08
6 2020-08-08
7 2020-08-08
8 2020-08-22
9 2020-08-24

想法是創建組缺失的值Series.notnaSeries.cumsum ,並通過創建計數器GroupBy.cumcount ,由多個天數Series.mul轉換到timedeltas由to_timedelta添加什么來轉發與填充缺失值ffill

num_days = 10
g = df['Comp_date'].notna().cumsum()
days = pd.to_timedelta(df.groupby(g).cumcount().mul(num_days), unit='d')

df['Comp_date'] = df['Comp_date'].ffill().add(days)
print (df)
   Comp_date
0 2020-04-24
1 2020-05-04
2 2020-05-14
3 2020-05-24
4 2020-08-06
5 2020-08-16
6 2020-08-26
7 2020-09-05
8 2020-08-22
9 2020-09-01

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM