Pandas dataframe由一些值组成

Question

I have this data 我有这些数据

import numpy as np
import pandas as pd
group = {'gender': ['male', 'female', 'female', 'male', 'female', 'male', 'male'],
        'height': [175, 168, np.nan, 170, 167, np.nan, 190],
        }
labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
df = pd.DataFrame(group, index=labels)
df2 = df.groupby('gender')['height'].mean()

and i want to fill nan with mean value from df2 我想用df2的平均值填充nan

Answer 1

code 码

import pandas as pd
import numpy as np

group = {'gender': ['male', 'female', 'female', 'male', 'female', 'male', 'male'],
        'height': [175, 168, np.nan, 170, 167, np.nan, 190],
        }
labels = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
df = pd.DataFrame(group, index=labels)
df2 = df.groupby('gender')['height'].mean()
df['height'].fillna(df['gender'].map(df2), inplace=True)
# print(df2)
print(df)

output 产量

   gender      height
a    male  175.000000
b  female  168.000000
c  female  167.500000
d    male  170.000000
e  female  167.000000
f    male  178.333333
g    male  190.000000

Answer 2

You can use groupby + transform with mean . 您可以使用groupby + transform with mean 。 Then fillna with the resulting series. 然后fillna与结果系列。

means = df.groupby('gender')['height'].transform('mean')
df['height'] = df['height'].fillna(means)

print(df)

   gender      height
a    male  175.000000
b  female  168.000000
c  female  167.500000
d    male  170.000000
e  female  167.000000
f    male  178.333333
g    male  190.000000

Pandas dataframe由一些值组成

问题描述

2 个解决方案

解决方案1
3 2018-07-28 11:08:11

解决方案2
2 2018-07-28 11:08:01

Pandas dataframe由一些值组成

问题描述

2 个解决方案

解决方案1 3 2018-07-28 11:08:11

解决方案2 2 2018-07-28 11:08:01

解决方案1
3 2018-07-28 11:08:11

解决方案2
2 2018-07-28 11:08:01