熊貓-讀取數據（兩行標頭，索引列）

Question

我有一個看起來像這樣的數據文件（來自TCGA的miRNA-seq數據）：

A X X X Y Y Y Z Z Z
B a b c a b c a b c
0
1   regular 5x9
2   data matrix
3
4

A描述了第一標題行， B描述了第一列。 我想使用pandas.read_csv返回一個DataFrame，這樣我就可以按df[0]類的方式訪問行，並按df['X']['a']類的方式訪問列，最終刪除選定的行和/或列。 在我的搜索中，我發現MultiIndex可以幫助我，但是df = pandas.read_csv("datafile", header=[0, 1]); print(df.index) df = pandas.read_csv("datafile", header=[0, 1]); print(df.index)確實返回Index 。

感謝您的任何建議。

編輯：一些示例數據（制表符分隔）

Hybridization REF   TCGA-2V-A95S-01A-11R-A37G-13    TCGA-2V-A95S-01A-11R-A37G-13    TCGA-2V-A95S-01A-11R-A37G-13    TCGA-2Y-A9GS-01A-12R-A38M-13    TCGA-2Y-A9GS-01A-12R-A38M-13    TCGA-2Y-A9GS-01A-12R-A38M-13    TCGA-2Y-A9GT-01A-11R-A38M-13    TCGA-2Y-A9GT-01A-11R-A38M-13    TCGA-2Y-A9GT-01A-11R-A38M-13
miRNA_ID    read_count  reads_per_million_miRNA_mapped  cross-mapped    read_count  reads_per_million_miRNA_mapped  cross-mapped    read_count  reads_per_million_miRNA_mapped  cross-mapped
hsa-let-7a-1    17377   4045.749542 N   47187   7077.368096 N   31765   8956.551210 N
hsa-let-7a-2    34913   8128.517796 N   94766   14213.530526    Y   64148   18087.355487    N
hsa-let-7a-3    17496   4073.455371 N   47683   7151.760928 N   31782   8961.344580 N
hsa-let-7b  33546   7810.249993 N   46089   6912.683963 N   64948   18312.925799    N
hsa-let-7c  1349    314.077006  N   12185   1827.573913 Y   14075   3968.627681 N
hsa-let-7d  1735    403.946335  N   1763    264.424523  N   1176    331.588359  N

Answer 1

試試看：

df=pd.read_csv('zhoop.csv', header=[0,1], index_col=0)

注意：為了索引行，您將使用df.loc [rownum]，而不僅僅是df [rownum]。

熊貓-讀取數據（兩行標頭，索引列）

問題描述

1 個解決方案

解決方案1
2 已采納 2018-01-18 21:17:31

熊貓-讀取數據（兩行標頭，索引列）

問題描述

1 個解決方案

解決方案1 2 已采納 2018-01-18 21:17:31

解決方案1
2 已采納 2018-01-18 21:17:31