簡體   English   中英

統計特定時間出現的次數 window Python

[英]Count occurrences in a specific time window Python

我的數據包含現場人員拜訪客戶的時間。 我需要做的是計算每一天和每個客戶的訪問次數(在特定時間范圍內 - 例如,從早上 8 點到晚上 8 點每 15 分鍾一次。)理想情況下,繪制直方圖的分布x 軸上的時間間隔和 y 軸上的事件。

這是我當前的數據框的樣子:

客戶 小時
一種 11:14:48 周一
一種 11:24:34 周一
15:34:34 周二
13:34:35 周二
15:10:22 周二
15:01:02 周二
... ... ...

output 應該是這樣的,比我可以使用 plot 直方圖:

間隔 客戶 出現次數
8:00:00 - 8:15:00 一種 0 周一
... ... ... ...
11:00:00 - 11:15:00 一種 1個 周一
11:15:00 - 11:30:00 一種 1個 周一
... ... ... ...

提前致謝!

誠然 hacky,但應該工作。 如果有人有更好的解決方案,請告訴我。 如果您有實際的日期時間而不是時間間隔和日期名稱之間的混合,這會更容易。

這是我正在使用的數據:

df = pd.DataFrame({'Client':['A', 'A', 'B', 'B', 'B', 'B'],
                   'Hour': ['11:14:48', '11:24:34', '15:34:34', '13:34:35', '15:10:22', '15:01:02'],
                   'Day':['Monday', 'Monday', 'Tuesday', 'Tuesday', 'Tuesday', 'Tuesday']})

這里的代碼:

TIME_START = '08:00:00'
TIME_END = '20:00:00'
INTERVAL = '15min'

def reindex_by_date(df):
    df['Hour'] = pd.to_datetime('1970-1-1 ' + df['Hour'].astype(str))
    dt_index = pd.DatetimeIndex(pd.date_range(start=f'1970-1-1 {TIME_START}', end=f'1970-1-1 {TIME_END}', freq=INTERVAL))
    resampled_df = df.resample('15min', on='Hour').count().reindex(dt_index).fillna(0).rename(columns={'Hour':'Occurrences'}).rename_axis('Hour').reset_index()
    resampled_df['Client'] = df['Client'].iat[0]
    resampled_df['Day'] = df['Day'].iat[0]
    resampled_df['Hour'] = resampled_df['Hour'].dt.strftime('%H:%M:%S') + ' - ' + (resampled_df['Hour'] + pd.Timedelta(minutes=15)).dt.strftime('%H:%M:%S')
    return resampled_df.rename(columns={'Hour':'Interval'})

result = df.groupby(['Client', 'Day'], as_index=False).apply(reindex_by_date).reset_index(0, drop=True)

result看起來像這樣:

               Interval Client  Occurrences      Day
0   08:00:00 - 08:15:00      A          0.0   Monday
1   08:15:00 - 08:30:00      A          0.0   Monday
2   08:30:00 - 08:45:00      A          0.0   Monday
3   08:45:00 - 09:00:00      A          0.0   Monday
4   09:00:00 - 09:15:00      A          0.0   Monday
..                  ...    ...          ...      ...
44  19:00:00 - 19:15:00      B          0.0  Tuesday
45  19:15:00 - 19:30:00      B          0.0  Tuesday
46  19:30:00 - 19:45:00      B          0.0  Tuesday
47  19:45:00 - 20:00:00      B          0.0  Tuesday
48  20:00:00 - 20:15:00      B          0.0  Tuesday

[98 rows x 4 columns]

而非零條目是:

               Interval Client  Occurrences      Day
12  11:00:00 - 11:15:00      A          1.0   Monday
13  11:15:00 - 11:30:00      A          1.0   Monday
22  13:30:00 - 13:45:00      B          1.0  Tuesday
28  15:00:00 - 15:15:00      B          2.0  Tuesday
30  15:30:00 - 15:45:00      B          1.0  Tuesday

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM