簡體   English   中英

groupby 顯示每人每天的時間 pandas

[英]groupby to display time per day per person pandas

我正在嘗試按 ID、時間戳過濾此 dataframe,我的第三列是條目之間的時間差異。 我可以讓它顯示所有天每個 id 的總和,但不能讓它顯示每個 id 每天的總和。

import datetime
import pandas as pd
timestamps = [
    datetime.datetime(2018, 1, 1, 10, 0, 0, 0), # person 1
    datetime.datetime(2018, 1, 1, 10, 0, 0, 0), # person 2
    datetime.datetime(2018, 1, 1, 11, 0, 0, 0), # person 2
    datetime.datetime(2018, 1, 2, 11, 0, 0, 0), # person 2
    datetime.datetime(2018, 1, 1, 10, 0, 0, 0), # person 3
    datetime.datetime(2018, 1, 2, 11, 0, 0, 0), # person 3
    datetime.datetime(2018, 1, 4, 10, 0, 0, 0), # person 3
    datetime.datetime(2018, 1, 5, 12, 0, 0, 0)  # person 3
]
df1 = pd.DataFrame({'person': [1, 2, 1, 3, 2, 1, 3, 2], 'timestamp': timestamps}) 
df1['new'] = df1.groupby('person').timestamp.transform(pd.Series.diff).dropna()
                               
df1.groupby('person')['timestamp','new'].sum()

這只是給我總數,而不是每天。 我如何每天組合它們?

您可以像這樣在 groupby 條件中包含“時間戳”列的日期部分:

>>> df1.groupby(["person", df1.timestamp.dt.date])["new"].sum()

此外,如果您願意,可以使用時間戳中的日期創建一個新列,然后按該列分組:

>>> df1["date"] = df1["timestamp"].dt.date
>>> df1.groupby(["person", "date"])["new"].sum()

或者,您可以在末尾使用.reset_index()將您的組值包含在新列中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM