繁体   English   中英

如何使用 python pandas 删除 csv 中列中的精确重复项

[英]How to delete an exact duplicates in a column in csv using python pandas

所以我正在做一些基本的数据处理。 在“updated_at”列中,我多次显示相同的值。 如何删除除一个以外的所有内容? 希望图片有帮助。 让我知道你们是否需要更多说明。

df = df.set_index("updated_at")
new_df = df.where(~df.apply(pd.Series.duplicated, 1), "").reset_index()

我尝试了上面的代码但没有用

[图片]

1

import pandas as pd

df = pd.read_csv(filepath)
new_df = df.drop_duplicates(subset=['updated_at'])
new_df

如果您只需要考虑列 updated_add 您可以使用下面的代码。 如果您需要在删除行之前所有列中的元素相同,则可以选择删除子集参数。

data.drop_duplicates(子集=“updated_at”,就地=真)

有关更多选项,请参见下面的链接https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.ZFC35FDC70D5FC69D2698Z83A822C7A53E

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM