根據刪除級別內的所有行的列值過濾多索引數據幀

Question

我正在嘗試根據一個或多個值過濾 DataFrame。 這是一個示例 CSV：

AlignmentId,TranscriptId,classifier,value
ENSMUST00000025010-1,ENSMUST00000025010,AlnCoverage,0.99612
ENSMUST00000025010-1,ENSMUST00000025010,AlnIdentity,0.93553
ENSMUST00000025010-1,ENSMUST00000025010,Badness,0.06749
ENSMUST00000025014-1,ENSMUST00000025014,AlnCoverage,1.0
ENSMUST00000025014-1,ENSMUST00000025014,AlnIdentity,0.96382
ENSMUST00000025014-1,ENSMUST00000025014,Badness,0.03618

加載時：

>>> df = pd.read_csv('tmp.csv', index_col=['AlignmentId', 'TranscriptId'])
>>> df
                                          classifier    value
AlignmentId          TranscriptId
ENSMUST00000025010-1 ENSMUST00000025010  AlnCoverage  0.99612
                     ENSMUST00000025010  AlnIdentity  0.93553
                     ENSMUST00000025010      Badness  0.06749
ENSMUST00000025014-1 ENSMUST00000025014  AlnCoverage  1.00000
                     ENSMUST00000025014  AlnIdentity  0.96382
                     ENSMUST00000025014      Badness  0.03618

我想刪除所有未通過一系列classifiers AlignmentId組。 對於這個例子，假設我想刪除ENSMUST00000025010因為AlnCoverage < 1.0 。 因此，我想以這個數據框結束：

ENSMUST00000025014-1 ENSMUST00000025014  AlnCoverage  1.00000
                     ENSMUST00000025014  AlnIdentity  0.96382
                     ENSMUST00000025014      Badness  0.03618

我怎么能這樣做？

Answer 1

嘗試這個：

In [169]: df = df.drop(df[(df.classifier=='AlnCoverage') & (df.value < 1)].index)

In [170]: df
Out[170]:
                                          classifier    value
AlignmentId          TranscriptId
ENSMUST00000025014-1 ENSMUST00000025014  AlnCoverage  1.00000
                     ENSMUST00000025014  AlnIdentity  0.96382
                     ENSMUST00000025014      Badness  0.03618

根據刪除級別內的所有行的列值過濾多索引數據幀

問題描述

1 個解決方案

解決方案1
2 已采納 2016-09-15 21:50:09

根據刪除級別內的所有行的列值過濾多索引數據幀

問題描述

1 個解決方案

解決方案1 2 已采納 2016-09-15 21:50:09

解決方案1
2 已采納 2016-09-15 21:50:09