簡體   English   中英

從給定時間在一列中創建 15 分鍾的時間間隔,並在每個時間間隔中查找值的計數

[英]Create 15minute time intervals from given time in a column and find count of values in each time interval

鑒於此數據集包含事件日期時間和票證掃描的日期時間

事件名稱 事件日期時間 掃描日期時間
游戲 1 2018-10-17 19:30:00 2018-10-17 20:01:20
2018-10-17 19:20:10
2018-10-17 21:44:43
2018-10-17 20:30:46
2018-10-17 19:51:56
... ... ...
游戲 2 2019-04-10 19:30:00 2019-04-10 19:39:35
2019-04-10 30:30:49
2019-04-10 20:41:10
2019-04-10 19:46:20
2019-04-10 22:24:19

並且所需的 output 應該是一個列,在event_datetime之前和之后每 15 分鍾的時間間隔為scan_datetime

時間間隔 90-75 75-60 60-45 45-30 30-15 15-0 0-15 15-30 30-45 45-60
數數 2 1 5 6 4 3 25 7 4 1

首先,您在 scan_datetime 中展開列表。

df = df.explode("scan_datetime").reset_index(drop=True)

這將使每次掃描成為單獨的行。 我假設列表中的值是字符串,所以我們將它們轉換為日期時間:

df["scan_datetime"] = pd.to_datetime(df["scan_datetime"])

比你計算差異:

df["diff"] = df["event_datetime"] - df["scan_datetime"]
df["diff"] = (df["diff"].dt.total_seconds()/60).astype(int)

現在您以分鍾為單位的差異(有符號整數)。 比您以指定的時間間隔運行值計數。

df["diff"].value_counts(bins=[-90,-75,-60, -45, -30, -15, 0, 15, 30, 45, 60])

首先,您需要從scan_datetime列中提取日期時間,然后將其分解。 接下來,計算event_datetimescan_datetime列之間的時間差。 最后,bin 值和計數出現次數。

DT = r'\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}'
df['scan_datetime'] = df['scan_datetime'].str.findall(DT)

df = df.explode('scan_datetime').astype({'event_datetime': 'datetime64', 
                                         'scan_datetime': 'datetime64'})

df['diff'] = df['event_datetime'].sub(df['scan_datetime']).dt.total_seconds().div(60)

bins = np.arange(24*-15, 24*15+1, 15)
labels = [f'{abs(i)}-{abs(j)}' for i, j in zip(bins, bins[1:])]

out = pd.cut(df['diff'], bins=bins, labels=labels) \
        .value_counts(sort=False).to_frame('count').T

Output:

>>> out
       180-165  165-150  150-135  135-120  120-105  105-90  90-75  75-60  60-45  45-30  ...  30-45  45-60  60-75  75-90  90-105  105-120  120-135  135-150  150-165  165-180
count        1        0        0        1        0       0      0      3      0      1  ...      0      0      0      0       0        0        0        0        0        0

[1 rows x 24 columns]

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM