如何在 Pandas DataFrame 中以小時和分鍾為單位切片時間

Question

我正在嘗試從我的數據集中拆分時間列。 Time 列的值類似於“2324”而不是“23:24”。 我使用了這個命令 df['MINUTES']=df['MINUTES'].str[1:3]。 但它不能准確地工作，因為時間列是基於 24 小時的。 所以'2324'顯示為'23:32'這是不正確的。我如何將它們分成正確的方式。 請溫柔，我剛開始涉足 Python/DA 領域。

提前致謝！ 阿尼爾

Answer 1

我不確定問題出在哪里，因為有 24 小時的時間不應該影響腳本。 這是一個似乎與預期的 output 匹配的示例：

import pandas as pd
df = pd.DataFrame({'Example':['1242','1342','1532','1643','1758','1821','1902','0004','2324']})
df['Hour'] = df['Example'].str[:2]
df['Minute'] = df['Example'].str[2:]
df['Time'] = df['Example'].str[:2] + ":" + df['Example'].str[2:]

這將生成以下 output：

  Example Hour Minute   Time
0    1242   12     42  12:42
1    1342   13     42  13:42
2    1532   15     32  15:32
3    1643   16     43  16:43
4    1758   17     58  17:58
5    1821   18     21  18:21
6    1902   19     02  19:02
7    0004   00     04  00:04
8    2324   23     24  23:24

Answer 2

這是您可以執行的操作：

df['MINUTES'].replace(['(?<=\d\d)(?=\d\d)'], ':', regex=True, inplace=True)

我們基本上是在告訴 python 在這個間隙中插入一個冒號':' ： '(?<=\d\d)(?=\d\d)' ，它在每邊的兩位數之間。

讓我們測試一下：

import pandas as pd

df = pd.DataFrame({'MINUTES':['1234',
                              '7654',
                              '8766']})

df['MINUTES'].replace(['(?<=\d\d)(?=\d\d)'], ':',
                      regex=True,
                      inplace=True)

print(df)

Output：

  MINUTES
0   12:34
1   76:54
2   87:66

如何在 Pandas DataFrame 中以小時和分鍾為單位切片時間

問題描述

2 個解決方案

解決方案1
0 已采納 2020-07-05 18:30:12

解決方案2
0 2020-07-05 19:24:00

如何在 Pandas DataFrame 中以小時和分鍾為單位切片時間

問題描述

2 個解決方案

解決方案1 0 已采納 2020-07-05 18:30:12

解決方案2 0 2020-07-05 19:24:00

解決方案1
0 已采納 2020-07-05 18:30:12

解決方案2
0 2020-07-05 19:24:00