簡體   English   中英

Pandas:強制列在 DataFrame 中的位置(不知道所有列)

[英]Pandas: Force position of column in DataFrame (without knowing all columns)

假設我有一個 DataFrame 並且不知道所有列的名稱。 但是,我知道有一個名為"N_DOC"的列,我希望它成為 DataFrame 的第一列 - (同時保留所有其他列,無論其順序如何)。

我怎樣才能做到這一點?

您可以使用reindex重新排序數據框的列:

cols = df.columns.tolist()
cols.remove('N_DOC')
df.reindex(['N_DOC'] + cols, axis=1)

使用DataFrame.insertDataFrame.pop提取列:

df = pd.DataFrame({
        'A':list('abcdef'),
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,2,3],
         'N_DOC':[1,3,5,7,1,0],
         'E':[5,3,6,9,2,4],
         'F':list('aaabbb')
})

c = 'N_DOC'
df.insert(0, c, df.pop(c))

或者:

df.insert(0, 'N_DOC', df.pop('N_DOC'))

print (df)
   N_DOC  A  B  C  E  F
0      1  a  4  7  5  a
1      3  b  5  8  3  a
2      5  c  4  9  6  a
3      7  d  5  4  9  b
4      1  e  5  2  2  b
5      0  f  4  3  4  b

這是一個使用 DataFrame 掩碼的簡單單行解決方案:

import pandas as pd

# Building sample dataset.
cols = ['N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe', 'N_DOC']
df = pd.DataFrame(columns=cols)

# Re-order columns.
df = df[['N_DOC'] + df.columns.drop('N_DOC').tolist()]

前:

Index(['N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe', 'N_DOC'], dtype='object')

后:

Index(['N_DOC', 'N_DOCa', 'N_DOCb', 'N_DOCc', 'N_DOCd', 'N_DOCe'], dtype='object')

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM