將DataFrame列組織到MultiIndex中

Question

我想將數據框的列組織成組。 通常，當我進行分析時，我可能會遇到標識符變量，自變量和因變量之類的東西，並且我認為在組織上將所有這些變量放到共同的標題下是很不錯的。

這是一個例子

import string
import pandas as pd

df = pd.DataFrame({"a": list(string.ascii_lowercase[:5]),
               "b" : np.arange(0,5), 
               "c":list(string.ascii_uppercase[:5]), 
               "d" : np.arange(5,10)})
index1 = pd.MultiIndex.from_product([["Letter"], ["a","c"]])
index2 = pd.MultiIndex.from_product([["Number"], ["b", "d"]])
index = index1.union(index2)
df.columns = index

這並不完全有效。

    Letter  Number
    a   c   b   d
0   a   0   A   5
1   b   1   B   6
2   c   2   C   7
3   d   3   D   8
4   e   4   E   9

相反，我需要添加

  df = df[index.get_level_values(1)]
  df.columns = index

重新排列列，以便它們在更改索引之前與第二級多索引對齊。 這感覺有些笨拙，我只是想知道是否有更好的方法可以做到這一點。

Answer 1

這是一個很好的解決方案：

import string
import pandas as pd

df = pd.DataFrame({"a": list(string.ascii_lowercase[:5]),
               "b" : np.arange(0,5), 
               "c":list(string.ascii_uppercase[:5]), 
               "d" : np.arange(5,10)})
index1 = pd.MultiIndex.from_product([["Letter"], ["a","c"]])
index2 = pd.MultiIndex.from_product([["Number"], ["b", "d"]])
index = index1.union(index2)
df.columns = index

print(df)
  Letter    Number   
       a  c      b  d
0      a  0      A  5
1      b  1      B  6
2      c  2      C  7
3      d  3      D  8
4      e  4      E  9

扁平化多索引列的更Python方式

df.columns = df.columns.map('_'.join)
print(df)

輸出：

Letter_a  Letter_c Number_b  Number_d
0        a         0        A         5
1        b         1        B         6
2        c         2        C         7
3        d         3        D         8
4        e         4        E         9

將DataFrame列組織到MultiIndex中

問題描述

1 個解決方案

解決方案1
0 2017-05-09 04:04:34

將DataFrame列組織到MultiIndex中

問題描述

1 個解決方案

解決方案1 0 2017-05-09 04:04:34

解決方案1
0 2017-05-09 04:04:34