熊猫：用下一个非NaN /＃连续NaN填充NaNs

Question

我正在寻找一个熊猫系列，并用下一个数值的平均值填充NaN ，其中： average = next numerical value / (# consecutive NaNs + 1)

到目前为止，这是我的代码，我只是无法弄清楚如何在num中将filler列除以NaN （以及下一个数值）：

import pandas as pd

dates = pd.date_range(start = '1/1/2016',end = '1/12/2016', freq = 'D')
nums = [10, 12, None, None, 39, 10, 11, None, None, None, None, 60]

df = pd.DataFrame({
        'date':dates, 
        'num':nums
        })

df['filler'] = df['num'].fillna(method = 'bfill')

电流输出：

         date   num  filler
0  2016-01-01  10.0    10.0
1  2016-01-02  12.0    12.0
2  2016-01-03   NaN    39.0
3  2016-01-04   NaN    39.0
4  2016-01-05  39.0    39.0
5  2016-01-06  10.0    10.0
6  2016-01-07  11.0    11.0
7  2016-01-08   NaN    60.0
8  2016-01-09   NaN    60.0
9  2016-01-10   NaN    60.0
10 2016-01-11   NaN    60.0
11 2016-01-12  60.0    60.0

期望的输出：

         date   num
0  2016-01-01  10.0
1  2016-01-02  12.0
2  2016-01-03  13.0
3  2016-01-04  13.0
4  2016-01-05  13.0
5  2016-01-06  10.0
6  2016-01-07  11.0
7  2016-01-08  12.0
8  2016-01-09  12.0
9  2016-01-10  12.0
10 2016-01-11  12.0
11 2016-01-12  12.0

Answer 1

采取逆向的cumsum notnull
用它来groupby并用mean transform

csum = df.num.notnull()[::-1].cumsum()
filler = df.num.fillna(0).groupby(csum).transform('mean')
df.assign(filler=filler)

         date   num  filler
0  2016-01-01  10.0    10.0
1  2016-01-02  12.0    12.0
2  2016-01-03   NaN    13.0
3  2016-01-04   NaN    13.0
4  2016-01-05  39.0    13.0
5  2016-01-06  10.0    10.0
6  2016-01-07  11.0    11.0
7  2016-01-08   NaN    12.0
8  2016-01-09   NaN    12.0
9  2016-01-10   NaN    12.0
10 2016-01-11   NaN    12.0
11 2016-01-12  60.0    12.0

这个怎么运作

df.num.notnull().cumsum()是一种查找连续空值组的标准技术。 但是，我希望我的组以下一个数值结束。 所以我颠倒了系列，然后是cumsum 。
我希望我的平均值包括空值的数量。 最简单的方法是填充零，并对刚刚制作的组II采取正常的平均值。
transform为现有索引的广播
assign新列。 尽管已经扭转了这个系列，但该指数将像魔术一样重新调整。 可以使用loc但是会覆盖现有的df 。 如果他们愿意，我会让OP决定覆盖。

熊猫：用下一个非NaN /＃连续NaN填充NaNs

问题描述

1 个解决方案

解决方案1
11 已采纳 2017-04-19 23:46:11

熊猫：用下一个非NaN /＃连续NaN填充NaNs

问题描述

1 个解决方案

解决方案1 11 已采纳 2017-04-19 23:46:11

解决方案1
11 已采纳 2017-04-19 23:46:11