將 dataframe 中的第一行添加到列標題

Question

我在 pandas 中的 dataframe 看起來像這樣：

| Location1 |     |      | Location2 |     |    | Location3 |     |     |
|-----------|-----|------|-----------|-----|----|-----------|-----|-----|
| A1        | B1  | C1   | A1        | B1  | C1 | A1        | B1  | C1  |
| 123       | 457 | 268  | 78        | 12  | 34 | 234       | 456 | 456 |
| 435       | 234 | 5436 | 34        | 679 | 37 | 7546      | 45  | 64  |

其中第一行實際上是將當前 header 分解為子部分的輔助 header。

是否可以將第一行向上移動到標題和 dataframe 值之外？ 可以使用multilevel嗎？ 例如下面的東西

| Location1 |     |      | Location2 |     |    | Location3 |     |     |
| A1        | B1  | C1   | A1        | B1  | C1 | A1        | B1  | C1  |
|-----------|-----|------|-----------|-----|----|-----------|-----|-----|
| 123       | 457 | 268  | 78        | 12  | 34 | 234       | 456 | 456 |
| 435       | 234 | 5436 | 34        | 679 | 37 | 7546      | 45  | 64  |

Answer 1

嘗試這個：

df.columns = pd.MultiIndex.from_tuples([df.columns ,df.iloc[0]])

Answer 2

import pandas as pd
import numpy as np
df = pd.DataFrame(
    data=np.random.randint(
        0, 10, (6,4)),
    columns=["a", "b", "c", "d"])
df.columns = pd.MultiIndex.from_tuples(
    zip(['A', 'B','C', 'D'], 
        df.columns))
print(df)

Output

   A  B  C  D
   a  b  c  d
0  2  6  4  6
1  5  0  5  1
2  9  6  6  1
3  8  9  7  4
4  6  5  6  6
5  3  9  1  5

資料來源： https://www.delftstack.com/howto/python-pandas/how-to-add-header-row-to-a-pandas-dataframe/

Answer 3

您可以使用：

cols = df.filter(regex=r'\S').columns   # Get current non-blank column names
new_idx = pd.MultiIndex.from_product([cols, df.iloc[0, 0:3].to_numpy()])  # create multi-index from extracted non-blank columns and from row 0 repeating 3 elements
df.columns = new_idx      # set new multi-index to columns index
df = df.iloc[1:]          # Skip first row for data

結果：

print(df)


  Location1            Location2          Location3          
         A1   B1    C1        A1   B1  C1        A1   B1   C1
1       123  457   268        78   12  34       234  456  456
2       435  234  5436        34  679  37      7546   45   64


print(df.columns)


MultiIndex([('Location1', 'A1'),
            ('Location1', 'B1'),
            ('Location1', 'C1'),
            ('Location2', 'A1'),
            ('Location2', 'B1'),
            ('Location2', 'C1'),
            ('Location3', 'A1'),
            ('Location3', 'B1'),
            ('Location3', 'C1')],
           )

將 dataframe 中的第一行添加到列標題

問題描述

3 個解決方案

解決方案1
0 已采納 2021-05-14 19:15:58

解決方案2
0 2021-05-14 19:23:58

解決方案3
0 2021-05-14 19:46:14

將 dataframe 中的第一行添加到列標題

問題描述

3 個解決方案

解決方案1 0 已采納 2021-05-14 19:15:58

解決方案2 0 2021-05-14 19:23:58

解決方案3 0 2021-05-14 19:46:14

解決方案1
0 已采納 2021-05-14 19:15:58

解決方案2
0 2021-05-14 19:23:58

解決方案3
0 2021-05-14 19:46:14