pandas groupby，只保留第一次出現的行

Question

對於我希望實現的目標，這是一個緩慢的解決方案。 問題是性能。 沒有用戶定義的功能，是否有更“寬泛”的方法來實現這一目標？ 目標是僅保留每個組中出現的第一個時間戳的所有行。

def get_first_id_time(df):
    first_time = df['datetime'][0]
    df = df.loc[df['datetime']==first_time]

    return df

data = data.groupby('id').apply(get_first_id_time)

編輯：注意，每個組有許多行datetime = first_time。

Answer 1

你能獲得min日期時間並merge嗎？

min_datetime = data.groupby('id')['datetime'].min().reset_index()

data = data.merge(min_datetime, how='inner', on='id')

編輯：

由於有許多行具有相同的first_datetime ，因此只需merge datetime和id 。

pandas groupby，只保留第一次出現的行

問題描述

1 個解決方案

解決方案1
3 2019-04-12 14:29:21

pandas groupby，只保留第一次出現的行

問題描述

1 個解決方案

解決方案1 3 2019-04-12 14:29:21

解決方案1
3 2019-04-12 14:29:21