[英]How to delete an exact duplicates in a column in csv using python pandas
所以我正在做一些基本的数据处理。 在“updated_at”列中,我多次显示相同的值。 如何删除除一个以外的所有内容? 希望图片有帮助。 让我知道你们是否需要更多说明。
df = df.set_index("updated_at")
new_df = df.where(~df.apply(pd.Series.duplicated, 1), "").reset_index()
我尝试了上面的代码但没有用
[图片]
import pandas as pd
df = pd.read_csv(filepath)
new_df = df.drop_duplicates(subset=['updated_at'])
new_df
如果您只需要考虑列 updated_add 您可以使用下面的代码。 如果您需要在删除行之前所有列中的元素相同,则可以选择删除子集参数。
data.drop_duplicates(子集=“updated_at”,就地=真)
有关更多选项,请参见下面的链接https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.ZFC35FDC70D5FC69D2698Z83A822C7A53E
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.