設置熊貓數據框中的列順序

Question

有沒有辦法根據我的個人喜好對 pandas 數據框中的列進行重新排序（即不是按字母或數字排序，而是更像遵循某些約定）？

簡單的例子：

frame = pd.DataFrame({
        'one thing':[1,2,3,4],
        'second thing':[0.1,0.2,1,2],
        'other thing':['a','e','i','o']})

產生這個：

   one thing other thing  second thing
0          1           a           0.1
1          2           e           0.2
2          3           i           1.0
3          4           o           2.0

但相反，我想要這樣：

   one thing second thing  other thing
0          1           0.1           a
1          2           0.2           e
2          3           1.0           i
3          4           2.0           o

（請提供一個通用的解決方案，而不是針對這種情況。非常感謝。）

Answer 1

只需通過輸入列名自己選擇訂單。 注意雙括號：

frame = frame[['column I want first', 'column I want second'...etc.]]

Answer 2

你可以使用這個：

columnsTitles = ['onething', 'secondthing', 'otherthing']

frame = frame.reindex(columns=columnsTitles)

Answer 3

這是我經常使用的解決方案。 當您擁有包含大量列的大型數據集時，您絕對不想手動重新排列所有列。

您可以並且很可能想要做的只是訂購您經常使用的前幾列，而讓所有其他列成為它們自己。 這是 R 中的常用方法。 df %>%select(one, two, three, everything())

因此，您可以首先手動鍵入要排序的列，並在列表cols_to_order中的所有其他列之前定位。

然后通過組合其余列來構造新列的列表：

new_columns = cols_to_order + (frame.columns.drop(cols_to_order).tolist())

在此之后，您可以按照建議的其他解決方案使用new_columns 。

import pandas as pd
frame = pd.DataFrame({
    'one thing': [1, 2, 3, 4],
    'other thing': ['a', 'e', 'i', 'o'],
    'more things': ['a', 'e', 'i', 'o'],
    'second thing': [0.1, 0.2, 1, 2],
})

cols_to_order = ['one thing', 'second thing']
new_columns = cols_to_order + (frame.columns.drop(cols_to_order).tolist())
frame = frame[new_columns]

   one thing  second thing other thing more things
0          1           0.1           a           a
1          2           0.2           e           e
2          3           1.0           i           i
3          4           2.0           o           o

Answer 4

你也可以做類似df = df[['x', 'y', 'a', 'b']]

import pandas as pd
frame = pd.DataFrame({'one thing':[1,2,3,4],'second thing':[0.1,0.2,1,2],'other thing':['a','e','i','o']})
frame = frame[['second thing', 'other thing', 'one thing']]
print frame
   second thing other thing  one thing
0           0.1           a          1
1           0.2           e          2
2           1.0           i          3
3           2.0           o          4

此外，您可以通過以下方式獲取列列表：

cols = list(df.columns.values)

輸出將產生如下內容：

['x', 'y', 'a', 'b']

然后很容易手動重新排列。

Answer 5

用列表而不是字典來構造它

frame = pd.DataFrame([
        [1, .1, 'a'],
        [2, .2, 'e'],
        [3,  1, 'i'],
        [4,  4, 'o']
    ], columns=['one thing', 'second thing', 'other thing'])

frame

   one thing  second thing other thing
0          1           0.1           a
1          2           0.2           e
2          3           1.0           i
3          4           4.0           o

Answer 6

您還可以使用 OrderedDict：

In [183]: from collections import OrderedDict

In [184]: data = OrderedDict()

In [185]: data['one thing'] = [1,2,3,4]

In [186]: data['second thing'] = [0.1,0.2,1,2]

In [187]: data['other thing'] = ['a','e','i','o']

In [188]: frame = pd.DataFrame(data)

In [189]: frame
Out[189]:
   one thing  second thing other thing
0          1           0.1           a
1          2           0.2           e
2          3           1.0           i
3          4           2.0           o

Answer 7

添加“列”參數：

frame = pd.DataFrame({
        'one thing':[1,2,3,4],
        'second thing':[0.1,0.2,1,2],
        'other thing':['a','e','i','o']},
        columns=['one thing', 'second thing', 'other thing']
)

Answer 8

嘗試索引（所以你不僅需要一個通用的解決方案，所以索引順序可以是你想要的）：

l=[0,2,1] # index order
frame=frame[[frame.columns[i] for i in l]]

現在：

print(frame)

是：

   one thing second thing  other thing
0          1           0.1           a
1          2           0.2           e
2          3           1.0           i
3          4           2.0           o

Answer 9

即使這是一個老問題，您也可以使用loc和iloc ：

frame = frame.loc[:, ['column I want first', 'column I want second', "other thing"]]

frame = frame.iloc[:, [1, 3, 2]]

Answer 10

我發現這是最直接和最有效的：

df = pd.DataFrame({
        'one thing':[1,2,3,4],
        'second thing':[0.1,0.2,1,2],
        'other thing':['a','e','i','o']})

df = df[['one thing','second thing', 'other thing']]

Answer 11

df = df.reindex(columns=["A", "B", "C"])

設置熊貓數據框中的列順序

問題描述

11 個解決方案

解決方案1
201 已采納 2017-01-31 22:36:06

解決方案2
127 2017-11-24 07:09:13

解決方案3
72 2019-04-23 01:55:36

解決方案4
29 2017-01-31 22:40:32

解決方案5
13 2017-01-31 22:56:09

解決方案6
10 2017-01-31 22:40:54

解決方案7
6 2018-04-07 06:50:17

解決方案8
6 2018-10-17 07:04:09

解決方案9
4 2021-09-19 07:56:48

解決方案10
1 2019-02-19 12:31:30

解決方案11
1 2022-05-18 18:57:19

設置熊貓數據框中的列順序

問題描述

11 個解決方案

解決方案1 201 已采納 2017-01-31 22:36:06

解決方案2 127 2017-11-24 07:09:13

解決方案3 72 2019-04-23 01:55:36

解決方案4 29 2017-01-31 22:40:32

解決方案5 13 2017-01-31 22:56:09

解決方案6 10 2017-01-31 22:40:54

解決方案7 6 2018-04-07 06:50:17

解決方案8 6 2018-10-17 07:04:09

解決方案9 4 2021-09-19 07:56:48

解決方案10 1 2019-02-19 12:31:30

解決方案11 1 2022-05-18 18:57:19

解決方案1
201 已采納 2017-01-31 22:36:06

解決方案2
127 2017-11-24 07:09:13

解決方案3
72 2019-04-23 01:55:36

解決方案4
29 2017-01-31 22:40:32

解決方案5
13 2017-01-31 22:56:09

解決方案6
10 2017-01-31 22:40:54

解決方案7
6 2018-04-07 06:50:17

解決方案8
6 2018-10-17 07:04:09

解決方案9
4 2021-09-19 07:56:48

解決方案10
1 2019-02-19 12:31:30

解決方案11
1 2022-05-18 18:57:19