使用MultiIndex的Pandas數據框：排除級別值

Question

我有一個多索引的pandas數據幀，如下所示。

import numpy as np
import pandas as pd

arrays = [np.array(['bar', 'bar', 'bar', 'bar', 'foo', 'foo', 'qux', 'qux']),
          np.array(['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']),
          np.array(['blo', 'bla', 'bla', 'blo', 'blo', 'blu', 'blo', 'bla'])]

df = pd.DataFrame(np.random.randn(8, 4), index=arrays)

df.sort_index(inplace=True)

返回：

                    0         1         2         3
bar one bla  0.478461  1.030308  0.012688  0.137495
        blo  0.476041 -1.679848  1.346798  0.143225
    two bla  1.148882 -2.074197 -2.567959  1.258016
        blo  1.062280  3.846096 -0.346636  1.170822
foo one blo -0.761327  0.262105  0.151554  1.066616
    two blu  1.431951  0.043307 -0.326498  2.402536
qux one blo -0.622017 -0.566930  0.417977 -0.345238
    two bla  0.129273 -0.181396 -0.758381  0.995827

現在我想通過使用切片對象來選擇子集：

idx = pd.IndexSlice
subset = df.loc[idx[['bar'], :, :], :]

返回：

                    0         1         2         3
bar one bla  0.478461  1.030308  0.012688  0.137495
        blo  0.476041 -1.679848  1.346798  0.143225
    two bla  1.148882 -2.074197 -2.567959  1.258016
        blo  1.062280  3.846096 -0.346636  1.170822

現在我想排除所有具有“blo”作為級別值的行。 我知道我可以選擇除“blo”值之外的所有值，但我的真實數據幀非常大，我只知道不應出現在子集中的級別值。

從子集中排除某些級別值的最簡單方法是什么？

提前致謝！

Answer 1

IIUC，也許你可以掩飾你的子集：

subset = subset.iloc[subset.index.get_level_values(2) != 'blo']

Answer 2

你可以這樣做：

In [263]:
subset.loc[subset.index.get_level_values(2) != 'blo']

Out[263]:
                    0         1         2         3
bar one bla -1.039335 -1.124656  0.057114 -0.284754
    two bla  0.007208 -0.403559 -1.317075 -0.340171

使用MultiIndex的Pandas數據框：排除級別值

問題描述

2 個解決方案

解決方案1
5 已采納 2016-01-14 11:16:42

解決方案2
2 2016-01-14 11:16:33

使用MultiIndex的Pandas數據框：排除級別值

問題描述

2 個解決方案

解決方案1 5 已采納 2016-01-14 11:16:42

解決方案2 2 2016-01-14 11:16:33

解決方案1
5 已采納 2016-01-14 11:16:42

解決方案2
2 2016-01-14 11:16:33