簡體   English   中英

如何使用 python pandas 刪除 csv 中列中的精確重復項

[英]How to delete an exact duplicates in a column in csv using python pandas

所以我正在做一些基本的數據處理。 在“updated_at”列中,我多次顯示相同的值。 如何刪除除一個以外的所有內容? 希望圖片有幫助。 讓我知道你們是否需要更多說明。

df = df.set_index("updated_at")
new_df = df.where(~df.apply(pd.Series.duplicated, 1), "").reset_index()

我嘗試了上面的代碼但沒有用

[圖片]

1

import pandas as pd

df = pd.read_csv(filepath)
new_df = df.drop_duplicates(subset=['updated_at'])
new_df

如果您只需要考慮列 updated_add 您可以使用下面的代碼。 如果您需要在刪除行之前所有列中的元素相同,則可以選擇刪除子集參數。

data.drop_duplicates(子集=“updated_at”,就地=真)

有關更多選項,請參見下面的鏈接https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.ZFC35FDC70D5FC69D2698Z83A822C7A53E

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM