轉置多列 Pandas 數據框

Question

我正在嘗試重塑數據框，但無法獲得所需的結果。 數據框如下所示：

    m   r   s   p   O       W       N         
    1   4   3   1   2.81    3.70    3.03  
    1   4   4   1   2.14    2.82    2.31  
    1   4   5   1   1.47    1.94    1.59  
    1   4   3   2   0.58    0.78    0.60  
    1   4   4   2   0.67    0.00    0.00
    1   4   5   2   1.03    2.45    1.68
    1   4   3   3   1.98    1.34    1.81
    1   4   4   3   0.00    0.04    0.15
    1   4   5   3   0.01    0.00    0.26

我需要重塑數據框，使其看起來像這樣：

    m   r   s   p   O       W       N      p    O       W       N     p  O      W       N
    1   4   3   1   2.81    3.70    3.03   2    0.58    0.78    0.60  3  1.98   1.34    1.81
    1   4   4   1   2.14    2.82    2.31   2    0.67    0.00    0.00  3 0.00    0.04    0.15
    1   4   5   1   1.47    1.94    1.59   2    1.03    2.45    1.68  3 0.01    0.00    0.26

我嘗試使用pivot_table函數

df.pivot_table(index=['m','r','s'], columns=['p'], values=['O','W','N'])

但我無法得到我想要的。 有誰知道如何做到這一點？

Answer 1

作為一個自認為對pivot_table非常方便的人， pivot_table和melt函數讓我感到困惑。 我更喜歡堅持使用定義明確且唯一的索引，並使用數據幀本身的stack和unstack方法。

首先，我會問你是否真的需要像那樣重復 p 列？ 在呈現數據時我可以看到它的價值，但 IMO pandas 並沒有真正設置為那樣工作。 我們可以硬塞進去，但讓我們看看更簡單的解決方案是否能滿足您的需求。

這是我會做的：

from io import StringIO
import pandas

datatable = StringIO("""\
    m   r   s   p   O       W       N         
    1   4   3   1   2.81    3.70    3.03  
    1   4   4   1   2.14    2.82    2.31  
    1   4   5   1   1.47    1.94    1.59  
    1   4   3   2   0.58    0.78    0.60  
    1   4   4   2   0.67    0.00    0.00
    1   4   5   2   1.03    2.45    1.68
    1   4   3   3   1.98    1.34    1.81
    1   4   4   3   0.00    0.04    0.15
    1   4   5   3   0.01    0.00    0.26""")

df = (
    pandas.read_table(datatable, sep='\s+')
          .set_index(['m', 'r', 's', 'p'])
          .unstack(level='p')
)

df.columns = df.columns.swaplevel(0, 1)
df.sort(axis=1, inplace=True)

print(df)

哪個打印：

p         1                 2                 3            
          O     W     N     O     W     N     O     W     N
m r s                                                      
1 4 3  2.81  3.70  3.03  0.58  0.78  0.60  1.98  1.34  1.81
    4  2.14  2.82  2.31  0.67  0.00  0.00  0.00  0.04  0.15
    5  1.47  1.94  1.59  1.03  2.45  1.68  0.01  0.00  0.26

所以現在這些列是一個 MultiIndex 並且你可以訪問，例如，所有的值，其中p = 2與df[2]或df.xs(2, level='p', axis=1) ，這給了我：

          O     W     N
m r s                  
1 4 3  0.58  0.78  0.60
    4  0.67  0.00  0.00
    5  1.03  2.45  1.68

類似地，您可以使用以下命令獲取所有W列： df.xs('W', level=1, axis=1) （我們說level=1 ）因為該列級別沒有名稱，所以我們使用它的位置反而）

p         1     2     3
m r s                  
1 4 3  3.70  0.78  1.34
    4  2.82  0.00  0.04
    5  1.94  2.45  0.00

您可以使用axis=0類似地查詢列。

如果您真的需要列中的p值，只需手動添加它並重新索引您的列：

for p in df.columns.get_level_values('p').unique():
    df[p, 'p'] = p

cols = pandas.MultiIndex.from_product([[1,2,3], list('pOWN')])
df = df.reindex(columns=cols)
print(df)

       1                    2                    3                  
       p     O     W     N  p     O     W     N  p     O     W     N
m r s                                                               
1 4 3  1  2.81  3.70  3.03  2  0.58  0.78  0.60  3  1.98  1.34  1.81
    4  1  2.14  2.82  2.31  2  0.67  0.00  0.00  3  0.00  0.04  0.15
    5  1  1.47  1.94  1.59  2  1.03  2.45  1.68  3  0.01  0.00  0.26

Answer 2

    b = open('ss2.csv', 'w')
    a = csv.writer(b)
    sk = ''
    with open ('df_col2.csv', 'r') as ann:
        for col in ann:
            an = col.lower().strip('\n').split(',')
            suk += an[0] + ','
    sk = sk[:-2]
    a.writerow([sk])

轉置多列 Pandas 數據框

問題描述

2 個解決方案

解決方案1
6 已采納 2014-09-15 16:40:16

解決方案2
0 2021-03-25 14:05:48

轉置多列 Pandas 數據框

問題描述

2 個解決方案

解決方案1 6 已采納 2014-09-15 16:40:16

解決方案2 0 2021-03-25 14:05:48

解決方案1
6 已采納 2014-09-15 16:40:16

解決方案2
0 2021-03-25 14:05:48