如何使用 Pandas 從某個時間戳獲取 date_range？

Question

我需要將一年拆分為枚舉的 20 分鍾塊，然后為一年中隨機分布的時間戳找到相應時間范圍塊的序列號以進行進一步處理。 我嘗試為此使用 pandas，但我找不到在 date_range 中索引時間戳的方法：

#!/usr/bin/python3
# -*- coding: utf-8 -*-

import pandas as pd
from datetime import timedelta


if __name__ == '__main__':
    date_start = pd.to_datetime('2018-01-01')
    date_end = date_start + timedelta(days=365)
    index = pd.date_range(start=date_start, end=date_end, freq='20min')
    data = range(len(index))
    df = pd.DataFrame(data, index=index, columns=['A'])
    print(df)

    event_ts = pd.to_datetime('2018-10-14 02:17:43')
    # How to find the corresponding df['A'] for event_ts?
    # print(df.loc[event_ts])

Output：

                         A
2018-01-01 00:00:00      0
2018-01-01 00:20:00      1
2018-01-01 00:40:00      2
2018-01-01 01:00:00      3
2018-01-01 01:20:00      4
...                    ...
2018-12-31 22:40:00  26276
2018-12-31 23:00:00  26277
2018-12-31 23:20:00  26278
2018-12-31 23:40:00  26279
2019-01-01 00:00:00  26280

[26281 rows x 1 columns]

在 python 中執行此操作的最佳做法是什么？ 我想如何“手動”找到將 date_range 轉換為整數並進行比較的范圍，但可能有一些優雅的 pandas/python 風格的方法可以做到這一點？

Answer 1

首先，我的工作間隔很小，一周：

date_end = date_start + timedelta(days=7)

然后我按照你的步驟，得到了你的 dataframe 的一部分。

我的 event_ts 是這樣的：

event_ts = pd.to_datetime('2018-01-04 02:17:43')

而且我選擇了重置索引，並擁有一個易於操作的 dataframe：

 df = df.reset_index()

使用此代碼，我找到了 event_ts 所屬的最后一個值：

 for i in df['index']:
      if i <= event_ts:
          run.append(i)

 print(max(run))
 #2018-01-04 02:00:00
 or:
 top = max(run)

最后：

 df.loc[df['index'] == top].index[0]
 222

event_ts 屬於索引 df[222]

如何使用 Pandas 從某個時間戳獲取 date_range？

問題描述

1 個解決方案

解決方案1
0 已采納 2019-10-28 13:32:10

如何使用 Pandas 從某個時間戳獲取 date_range？

問題描述

1 個解決方案

解決方案1 0 已采納 2019-10-28 13:32:10

解決方案1
0 已采納 2019-10-28 13:32:10