pandas：刪除與之前的原始數據具有相同列值的行

Question

這是我的df：

data = { 'utime': [1461098442,1461098443,1461098443,1461098444,1461098445],
  'lat': [41.1790265,41.1791703,41.1791464,41.1791703,41.1791419],
  'lon': [-8.5951883,-8.5951229,-8.5951376,-8.5951229,-8.5951365]
}

df = pd.DataFrame(data)
df

       utime        lat        lon
0   1461098442  41.179026   -8.595188
1   1461098443  41.179170   -8.595123
2   1461098443  41.179146   -8.595138
3   1461098444  41.179170   -8.595123
4   1461098445  41.179142   -8.595137

同時收到兩個樣本（unix epoch 1461098443 ），所以我想保留 1，刪除另一個。

所以我有

       utime        lat        lon
0   1461098442  41.179026   -8.595188
1   1461098443  41.179170   -8.595123
3   1461098444  41.179170   -8.595123
4   1461098445  41.179142   -8.595137

Answer 1

drop_duplicates 應該有所幫助（閱讀https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.ZFC35FDC70D5FC69D269883A822C7A ）

df.drop_duplicates(subset='utime')

Answer 2

df = df.groupby('utime', as_index=False).agg('first')

        utime        lat       lon
0  1461098442  41.179026 -8.595188
1  1461098443  41.179170 -8.595123
2  1461098444  41.179170 -8.595123
3  1461098445  41.179142 -8.595137

pandas：刪除與之前的原始數據具有相同列值的行

問題描述

2 個解決方案

解決方案1
2 2022-09-16 17:49:47

解決方案2
0 已采納 2022-09-16 17:00:18

pandas：刪除與之前的原始數據具有相同列值的行

問題描述

2 個解決方案

解決方案1 2 2022-09-16 17:49:47

解決方案2 0 已采納 2022-09-16 17:00:18

解決方案1
2 2022-09-16 17:49:47

解決方案2
0 已采納 2022-09-16 17:00:18