如何用缺失的组合填充行熊猫

Question

我有以下熊猫数据框：

import pandas as pd
foo = pd.DataFrame({'id': [1,1,1,2,2,2,3,3,3,3,3], 'time': [2,3,5,1,3,4,1,2,6,7,8],
                    'val':['a','a','a','a','a','a','a','a','a','a','a']})

 id time    val
0   1   2   a
1   1   3   a
2   1   5   a
3   2   1   a
4   2   3   a
5   2   4   a
6   3   1   a
7   3   2   a
8   3   6   a
9   3   7   a
10  3   8   a

我想为每个id添加一行，为每个缺失的time添加一行，其中val为'b' 。 time将从1开始

生成的数据框看起来像这样

foo = pd.DataFrame({'id': [1,1,1,1,1,2,2,2,2,3,3,3,3,3,3,3,3], 'time': [1,2,3,4,5,1,2,3,4,1,2,3,4,5,6,7,8],
                    'val':['b','a','a','b','a','a','b','a','a','a','a','b','b','b','a','a','a']})


   id   time    val
0   1   1   b
1   1   2   a
2   1   3   a
3   1   4   b
4   1   5   a
5   2   1   a
6   2   2   b
7   2   3   a
8   2   4   a
9   3   1   a
10  3   2   a
11  3   3   b
12  3   4   b
13  3   5   b
14  3   6   a
15  3   7   a
16  3   8   a

有什么想法我可以在 python 中做到这一点吗？

这个答案不起作用，因为它没有考虑 groupby id以及id == 1的事实，我错过了time == 1

Answer 1

将数据帧的索引设置为time ，然后为每个id重新reindex time列，并用b填充val列中的NaN值

(
    foo
    .set_index('time').groupby('id')
    .apply(lambda g: g.reindex(range(1, g.index.max() + 1))) 
    .drop('id', axis=1).fillna({'val': 'b'}).reset_index()
)

如果您想尝试一些东西：fancy:，这是另一种解决方案：

(
    foo.groupby('id')['time'].max()
      .map(range).explode().add(1).reset_index(name='time')
      .merge(foo, how='left').fillna({'val': 'b'})
)

    id  time val
0    1     1   b
1    1     2   a
2    1     3   a
3    1     4   b
4    1     5   a
5    2     1   a
6    2     2   b
7    2     3   a
8    2     4   a
9    3     1   a
10   3     2   a
11   3     3   b
12   3     4   b
13   3     5   b
14   3     6   a
15   3     7   a
16   3     8   a

Answer 2

一种选择是完整的pyjanitor ：

# pip install pyjanitor
import pandas as pd
import janitor

# build a range of numbers for each group, starting from 1
new_time = {'time': lambda df: range(1, df.max() + 1)}

foo.complete(new_time, by = 'id', fill_value = 'b')

    id  time val
0    1     1   b
1    1     2   a
2    1     3   a
3    1     4   b
4    1     5   a
5    2     1   a
6    2     2   b
7    2     3   a
8    2     4   a
9    3     1   a
10   3     2   a
11   3     3   b
12   3     4   b
13   3     5   b
14   3     6   a
15   3     7   a
16   3     8   a

如何用缺失的组合填充行熊猫

问题描述

2 个解决方案

解决方案1
4 已采纳 2022-06-22 15:18:10

解决方案2
1 2022-06-22 21:30:54

如何用缺失的组合填充行熊猫

问题描述

2 个解决方案

解决方案1 4 已采纳 2022-06-22 15:18:10

解决方案2 1 2022-06-22 21:30:54

解决方案1
4 已采纳 2022-06-22 15:18:10

解决方案2
1 2022-06-22 21:30:54