Pandas fillna by each Group

Question

我有一个 pandas dataframe 有几个列。 我想用fillna's平均值填充 select 列。

import pandas as pd
import numpy as np

df = pd.DataFrame({
                   'cat': ['A','A','A','B','B','B','C','C'],
                   'v1': [10, 12, np.nan, 10, 14, np.nan, 11, np.nan],
                   'v2': [12, 8, np.nan, np.nan, 6, 12, 10, np.nan]
                 })

我正在寻找一种可扩展的解决方案，这意味着我可以应用在多个列上执行操作。

np.nan的将填充每组的mean 。

预计 output：

cat  v1   v2
 
A    10   12
A    12   8
A    11   10
B    10   9
B    14   6
B    12   12
C    11   10
C    11   10

其他类似的问题仅限于单个列，我正在寻找一种可推广的解决方案，并且可以为多个列输入缺失的NA 。

Answer 1

这将用列的平均值替换所有 np.nan

import pandas as pd
import numpy as np

df = pd.DataFrame({
                   'cat': ['A','A','A','B','B','B','C','C'],
                   'v1': [10, 12, np.nan, 10, 14, np.nan, 11, np.nan],
                   'v2': [12, 8, np.nan, np.nan, 6, 12, 10, np.nan]
                 })

for x in df.columns.drop('cat'):
    mean_of_column = df[x].mean()
    df[x].fillna(mean_of_column, inplace = True)
df

请注意，这将使该列成为浮点数，因为它们的意思不是整洁的整数。 但是，如果您愿意，可以继续使用它来删除小数点。

Answer 2

尝试这个：

df = df.fillna(df.groupby('cat').transform('mean'))

Output：

  cat    v1    v2
0   A  10.0  12.0
1   A  12.0   8.0
2   A  11.0  10.0
3   B  10.0   9.0
4   B  14.0   6.0
5   B  12.0  12.0
6   C  11.0  10.0
7   C  11.0  10.0

Pandas fillna by each Group

问题描述

2 个解决方案

解决方案1
1 2022-05-20 16:54:55

解决方案2
0 2022-05-23 02:30:50

Pandas fillna by each Group

问题描述

2 个解决方案

解决方案1 1 2022-05-20 16:54:55

解决方案2 0 2022-05-23 02:30:50

解决方案1
1 2022-05-20 16:54:55

解决方案2
0 2022-05-23 02:30:50