[英]How to delete an exact duplicates in a column in csv using python pandas
所以我正在做一些基本的數據處理。 在“updated_at”列中,我多次顯示相同的值。 如何刪除除一個以外的所有內容? 希望圖片有幫助。 讓我知道你們是否需要更多說明。
df = df.set_index("updated_at")
new_df = df.where(~df.apply(pd.Series.duplicated, 1), "").reset_index()
我嘗試了上面的代碼但沒有用
[圖片]
import pandas as pd
df = pd.read_csv(filepath)
new_df = df.drop_duplicates(subset=['updated_at'])
new_df
如果您只需要考慮列 updated_add 您可以使用下面的代碼。 如果您需要在刪除行之前所有列中的元素相同,則可以選擇刪除子集參數。
data.drop_duplicates(子集=“updated_at”,就地=真)
有關更多選項,請參見下面的鏈接https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.ZFC35FDC70D5FC69D2698Z83A822C7A53E
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.