合並熊貓中的時間戳列

Question

我有一個包含大量列的日志文件，我想將時間戳列合並為一個，如下例所示

start time  End time process ID. . . 
10:02       11:10    A       1
10:32       11:23    B       1
...         ....     A       2
...         ....     B       2
...         ....     C       2

注意：單個ID可以有多個類似的進程，例如一個ID中有多個A

time     process   ID . . .
10:02    A_start   1  
11:10    A_end     1
10:32    B_start   1
11:23    B_end     1
....     A_start   2
....     A_end     2
....     B_start   2
....       ...    ..

嘗試在熊貓上融化，但似乎我在這里遺漏了一些東西

df.melt(id_vars=["ID", "process"], 
        var_name="End time", 
        )

Answer 1

IIUC，您可以使用melt進行一些重塑：

out = (df
 .rename(columns={'start time': 'start', 'End time': 'end'})
 .melt(['process', 'ID'], value_name='time')
 .assign(process=lambda d: d['process']+'_'+d.pop('variable'))
)

輸出：

   process  ID   time
0  A_start   1  10:02
1  B_start   1  10:32
2    A_end   1  11:10
3    B_end   1  11:23

使用的輸入：

  start time End time process  ID
0      10:02    11:10       A   1
1      10:32    11:23       B   1

合並熊貓中的時間戳列

問題描述

1 個解決方案

解決方案1
1 已采納 2022-06-28 09:26:32

合並熊貓中的時間戳列

問題描述

1 個解決方案

解決方案1 1 已采納 2022-06-28 09:26:32

解決方案1
1 已采納 2022-06-28 09:26:32