如何在pandas DataFrame中通过共享列值替换某些行？

Question

假设我有以下pandas DataFrame：

import pandas as pd

data = [['Alex',10],['Bob',12],['Clarke',13], ['Bob', '#'], ['Bob', '#'], ['Bob', '#']]

df = pd.DataFrame(data,columns=['Name','Age'], dtype=float)
print(df)
     Name Age
0    Alex  10
1     Bob  12
2  Clarke  13
3     Bob   #
4     Bob   #
5     Bob   #

因此， Bob的DataFrame中有奇数行，即行3,4和5.这些值始终为# ，而不是12.第1行显示Bob应为12，而不是# 。

在这个例子中，使用replace()来解决这个问题很简单：

df = df.replace("#", 12)
print(df)
     Name Age
0    Alex  10
1     Bob  12
2  Clarke  13
3     Bob   12
4     Bob   12
5     Bob   12

但是，这不适用于较大的数据帧，例如

     Name Age
0    Alex  10
1     Bob  12
2  Clarke  13
3     Bob   #
4     Bob   #
5     Bob   #
6  Clarke   #

第6行应该是6 Clarke 13 。

如何使用#替换Age任何行，并使用其他行中给出的正确整数（基于Name ？ 如果#存在，请检查具有相同Name值的其他行并替换# 。

Answer 1

您想使用有效值来填充无效值吗？ 在这种情况下，使用map ：

v = df.assign(Age=pd.to_numeric(df['Age'], errors='coerce')).dropna()
df['Age'] = df['Name'].map(v.set_index('Name').Age)  

df
     Name   Age
0    Alex  10.0
1     Bob  12.0
2  Clarke  13.0
3     Bob  12.0
4     Bob  12.0
5     Bob  12.0
6  Clarke  13.0

Answer 2

试试这个，

d= df[df['Age']!='#'].set_index('Name')['Age']
df['Age']=df['Name'].replace(d)

O / P：

     Name Age
0    Alex  10
1     Bob  12
2  Clarke  13
3     Bob  12
4     Bob  12
5     Bob  12
6  Clarke  13

如何在pandas DataFrame中通过共享列值替换某些行？

问题描述

2 个解决方案

解决方案1
2 2018-12-05 04:24:25

解决方案2
2 已采纳 2018-12-05 04:27:05

如何在pandas DataFrame中通过共享列值替换某些行？

问题描述

2 个解决方案

解决方案1 2 2018-12-05 04:24:25

解决方案2 2 已采纳 2018-12-05 04:27:05

解决方案1
2 2018-12-05 04:24:25

解决方案2
2 已采纳 2018-12-05 04:27:05