熊貓表重新塑造| 使用小時創建datetime列

Question

我正在嘗試用熊貓重塑一張桌子。 一年中每天有365行的日期列。 每小時24列，每個值24列，對應當天的小時。 我正在嘗試使用day + hour（每天24行）和具有相應值的列創建列。 這是一個當前的頭（）：

Date          |    hour1     |    value1    |   hour2    |    value2    ... hour24    |     value 24

2016-01-01   |   1  |     4100  |    2   |    3500   |    24   |     5200

Here is the desired format:

Date                   |       value 

2016-01-01 01    |   4100

2016-01-01 02    |   3500

....

2016-01-01 24    |   5200

我已經嘗試過熔化和旋轉，但無法獲得分類日+小時列。

Answer 1

您需要lreshape通過dict ，然后加入hour小號轉化為to_timedelta和最后刪除列A由drop ，如有必要sort_values通過Date列：

print (df)
         Date  hour1  value1  hour2  value2  hour24  value24
0  2016-01-01      1    4100      2    3500      24     5200
1  2016-01-02      1    3000      2    3700      24     7200

a = [col for col in df.columns if col.startswith('hour')]
b = [col for col in df.columns if col.startswith('value')]

df = pd.lreshape(df, {'A' : a, 'B' : b})
df['Date'] = pd.to_datetime(df['Date']) + pd.to_timedelta(df['A'], unit='h')
df = df.drop('A', axis=1).sort_values('Date')
print (df)
                 Date     B
0 2016-01-01 01:00:00  4100
2 2016-01-01 02:00:00  3500
4 2016-01-02 00:00:00  5200
1 2016-01-02 01:00:00  3000
3 2016-01-02 02:00:00  3700
5 2016-01-03 00:00:00  7200

另一個解決方案是通過str.extract創建MultiIndex.from_arrays通過str.extract重新DataFrame.stack ：

df = df.set_index('Date')
mux = df.columns.to_series().str.extract('([A-Za-z]+)(\d+)', expand=True) 
df.columns = pd.MultiIndex.from_arrays([mux[0], mux[1]], names=('a','b'))
df = df.stack(1).reset_index()
df['Date'] = pd.to_datetime(df['Date']) + pd.to_timedelta(df['hour'], unit='h')
df = df.drop(['b', 'hour'], axis=1).rename_axis(None, axis=1)
print (df)
                 Date  value
0 2016-01-01 01:00:00   4100
1 2016-01-01 02:00:00   3500
2 2016-01-02 00:00:00   5200
3 2016-01-02 01:00:00   3000
4 2016-01-02 02:00:00   3700
5 2016-01-03 00:00:00   7200

熊貓表重新塑造| 使用小時創建datetime列

問題描述

1 個解決方案

解決方案1
0 已采納 2017-06-20 10:05:52

熊貓表重新塑造| 使用小時創建datetime列

問題描述

1 個解決方案

解決方案1 0 已采納 2017-06-20 10:05:52

解決方案1
0 已采納 2017-06-20 10:05:52