簡體   English   中英

如何將Pandas列多索引名稱作為列表

[英]How to get Pandas column multiindex names as a list

我有以下CSV數據:

id,gene,celltype,stem,stem,stem,bcell,bcell,tcell
id,gene,organs,bm,bm,fl,pt,pt,bm
134,foo,about_foo,20,10,11,23,22,79
222,bar,about_bar,17,13,55,12,13,88

我可以用這種方式成功地總結出來:

import pandas as pd
df = pd.read_csv("http://dpaste.com/1X74TNP.txt",header=None,index_col=[1,2]).iloc[:, 1:]

df.columns = pd.MultiIndex.from_arrays(df.ix[:2].values)
df = df.ix[2:].astype(int)
df.index.names = ['cell', 'organ']
df = df.reset_index('organ', drop=True)

result = df.groupby(level=[0, 1], axis=1).mean()
result = result.stack().replace(np.nan, 0).unstack()
result = result.swaplevel(0,1, axis=1).sort_index(axis=1)

看起來像:

In [341]: result
Out[341]:
        bm               fl               pt
     bcell stem tcell bcell stem tcell bcell stem tcell
cell
foo      0   15    79     0   11     0  22.5    0     0
bar      0   15    88     0   55     0  12.5    0     0

我的問題是,從result如何獲得第一級列列索引作為列表:

['bm','fl','pt']

result.columns返回一個pandas.core.index.MultiIndex ,它有一個levels屬性。

list(result.columns.levels[0])

回報

['bm', 'fl', 'pt']

另外你可以使用columnns.get_level_values(level)

 >>> result.columns.get_level_values(0).unique()
    array(['bm', 'fl', 'pt'], dtype=object)
 >>> list(result.columns.get_level_values(0))
    ['bm', 'bm', 'bm', 'fl', 'fl', 'fl', 'pt', 'pt', 'pt']

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM