[英]Drop duplicates of one column based on value in another column, Python, Pandas
[英]drop duplicates of one column based on duplicates of another column keeping the other column duplicates in pandas
保留 name 列的重复项,我想删除 Count 列的重复项,但 name 列的唯一值除外
这是一个例子 df
数数 | 姓名 |
---|---|
是的 | 约翰 |
是的 | 结婚 |
是的 | 结婚 |
是的 | 石田 |
是的 | 石田 |
是的 | 石田 |
我想要的结果是:
数数 | 姓名 |
---|---|
是的 | 约翰 |
是的 | 结婚 |
结婚 | |
是的 | 石田 |
石田 | |
石田 |
#熊猫#蟒蛇
逻辑是
groupby()
和cumcount()
实例df = pd.read_csv(io.StringIO("""Count name
yes jhon
yes marry
yes marry
yes ishita
yes ishita
yes ishita"""),sep="\t")
df.Count=np.where(df.groupby("name",as_index=False)["name"].cumcount()==0, df.Count, np.nan)
数数 | 姓名 | |
---|---|---|
0 | 是的 | 约翰 |
1 | 是的 | 结婚 |
2 | 楠 | 结婚 |
3 | 是的 | 石田 |
4 | 楠 | 石田 |
5 | 楠 | 石田 |
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.