![](/img/trans.png)
[英]drop duplicates in Python Pandas DataFrame not removing duplicates
[英]Python Pandas - Drop Duplicates
我有一個用例,我讀取 2 個 csv 文件,然后根據列值刪除重復項。 我的代碼如下:
input_path = "data1.csv"
df_v1 = pd.read_csv(input_path)
print(len(df_v1))
input_path2 = "data2.csv"
df_v2 = pd.read_csv(input_path2)
print(len(df_v2))
result = df_v1.append(df_v2, ignore_index=True)
result.drop_duplicates(subset = ['Time'], keep = 'first', inplace = True)
result.to_csv('output.csv', encoding='utf-8', index=False)
試試這個:
res = pd.concat([df1, df2], ignore_index=True).drop_duplicates(subset = ['Time'], keep = 'first', inplace = True)
在沒有看到實際數據的情況下進行瘋狂猜測,但一種可能性是時間列在一些小值上有所不同。 下面的時間被轉換為一個以 1 秒四舍五入的時間戳:
result = df_v1.append(df_v2, ignore_index=True)
result['Time'] = pd.to_datetime(result['Time']).dt.round('1s')
result.drop_duplicates(subset = ['Time'], keep = 'first', inplace = True)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.