繁体   English   中英

根据另一列的重复项删除一列的重复项,将另一列重复项保留在 pandas

[英]drop duplicates of one column based on duplicates of another column keeping the other column duplicates in pandas

保留 name 列的重复项,我想删除 Count 列的重复项,但 name 列的唯一值除外

这是一个例子 df

数数 姓名
是的 约翰
是的 结婚
是的 结婚
是的 石田
是的 石田
是的 石田

我想要的结果是:

数数 姓名
是的 约翰
是的 结婚
结婚
是的 石田
石田
石田

#熊猫#蟒蛇

逻辑是

  • namegroupby()cumcount()实例
  • 第 0 个实例,保持Count否则设置为NaN
df = pd.read_csv(io.StringIO("""Count   name
yes jhon
yes marry
yes marry
yes ishita
yes ishita
yes ishita"""),sep="\t")

df.Count=np.where(df.groupby("name",as_index=False)["name"].cumcount()==0, df.Count, np.nan)

数数 姓名
0 是的 约翰
1 是的 结婚
2 结婚
3 是的 石田
4 石田
5 石田

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM