如何在 pandas 中按顺序填充缺失的数据？

Question

我有一个数据如下。 如图所示，我需要为每个组估算周数。 我知道每个组的开始周数和一年中的周数。 我试过使用ffill() function 但这在这种情况下不起作用。 有没有内置的 function 或有效的方法？

group   year    week    week_imputed
A      2016     43          43
A   2016        44          44
A   2016       NaN          45
A   2016       NaN          46
A   2016       NaN          47
A   2016       48           48
A   2016       49           49
A   2016       50           50
A   2016       51           51
A   2016       52           52
A   2016       NaN          53
A   2017       NaN          1
A   2017       NaN          2
A   2017       NaN          3
A   2017       NaN          4
A   2017        5           5
A   2017       NaN          6
A   2017        7           7
A   2017       NaN          8
B   2016       47          47
B   2016       NaN         48
B   2016       NaN         49
B   2016       50          50
B   2016       51          51
B   2016       NaN         52
B   2017       NaN         1
B   2017       2           2

Answer 1

df['week_imputed'] = df.groupby([df.group, df.year]).week.fillna(method='ffill').fillna(value=1).astype(int) + \
                     df.groupby([df.group, df.year, df.week.notnull().cumsum()]).cumcount()

与 Pandas 类似的答案fillna 具有递增的值，除了用最初我使用ffill的值填充NaN ，然后 go 回到那些以NaN开头并将它们初始化为 1 的组，因为这是您想要的起始值。

output：

   group  year  week  week_imputed
0      A  2016  43.0            43
1      A  2016  44.0            44
2      A  2016   NaN            45
3      A  2016   NaN            46
4      A  2016   NaN            47
5      A  2016  48.0            48
6      A  2016  49.0            49
7      A  2016  50.0            50
8      A  2016  51.0            51
9      A  2016  52.0            52
10     A  2016   NaN            53
11     A  2017   NaN             1
12     A  2017   NaN             2
13     A  2017   NaN             3
14     A  2017   NaN             4
15     A  2017   5.0             5
16     A  2017   NaN             6
17     A  2017   7.0             7
18     A  2017   NaN             8
19     B  2016  47.0            47
20     B  2016   NaN            48
21     B  2016   NaN            49
22     B  2016  50.0            50
23     B  2016  51.0            51
24     B  2016   NaN            52
25     B  2017   NaN             1
26     B  2017   2.0             2

如何在 pandas 中按顺序填充缺失的数据？

问题描述

1 个解决方案

解决方案1
3 已采纳 2021-03-31 03:36:26

如何在 pandas 中按顺序填充缺失的数据？

问题描述

1 个解决方案

解决方案1 3 已采纳 2021-03-31 03:36:26

解决方案1
3 已采纳 2021-03-31 03:36:26