根据另一列的重复项删除一列的重复项，将另一列重复项保留在 pandas

Question

保留 name 列的重复项，我想删除 Count 列的重复项，但 name 列的唯一值除外

这是一个例子 df

数数	姓名
是的	约翰
是的	结婚
是的	结婚
是的	石田
是的	石田
是的	石田

我想要的结果是：

数数	姓名
是的	约翰
是的	结婚
	结婚
是的	石田
	石田
	石田

#熊猫#蟒蛇

Answer 1

逻辑是

name的groupby()和cumcount()实例
第 0 个实例，保持Count否则设置为NaN

df = pd.read_csv(io.StringIO("""Count   name
yes jhon
yes marry
yes marry
yes ishita
yes ishita
yes ishita"""),sep="\t")

df.Count=np.where(df.groupby("name",as_index=False)["name"].cumcount()==0, df.Count, np.nan)

	数数	姓名
0	是的	约翰
1	是的	结婚
2	楠	结婚
3	是的	石田
4	楠	石田
5	楠	石田

根据另一列的重复项删除一列的重复项，将另一列重复项保留在 pandas

问题描述

1 个解决方案

解决方案1
0 已采纳 2021-03-05 07:59:54

根据另一列的重复项删除一列的重复项，将另一列重复项保留在 pandas

问题描述

1 个解决方案

解决方案1 0 已采纳 2021-03-05 07:59:54

解决方案1
0 已采纳 2021-03-05 07:59:54