Pandas Multiindex数据帧删除行

Question

I have Multiiindex DF as follows: 我有Multiiindex DF如下：

tuples = list(zip(*[['a', 'a', 'b', 'b'], ['c', 'd', 'c', 'd']]))
index = pd.MultiIndex.from_tuples(tuples, names=['i1', 'i2'])
df = pd.DataFrame([5, 6, 7, 8], index=index[:4], columns=['col'])

       col
i1 i2     
a  c     5
   d     6
b  c     7
   d     8

Would like to keep rows whose index (level 0) is in 想保留索引（级别0）所在的行

idx_to_keep = ['a']

Should be a straightforward task, but I can't think of any other way than 应该是一个简单的任务，但我想不出任何其他方式

idx_to_drop = np.setdiff1d(pd.unique(df.index.levels[0]), idx_to_keep)
df.drop(idx_to_drop, inplace = True)

       col
i1 i2     
a  c     5
   d     6

Can I do better? 我可以做得更好吗？

Answer 1

One way is to use the index method get_level_values() : 一种方法是使用index方法get_level_values() ：

df
       col
i1 i2     
a  c     5
   d     6
b  c     7
   d     8

df[df.index.get_level_values(0).isin(idx_to_keep)]
       col
i1 i2     
a  c     5
   d     6

Answer 2

You are looking for .xs : 您正在寻找.xs ：

df.xs('a', axis=0, level=0, drop_level=False)

Which gives: 这使：

Answer 3

You can just use loc : 你可以使用loc ：

df.loc[['a']]

The resulting output: 结果输出：

Answer 4

Let's use slice 我们来使用slice

idx_to_keep = ['a']
df.loc[slice(*idx_to_keep,)]

Output: 输出：

Pandas Multiindex数据帧删除行

问题描述

4 个解决方案

解决方案1
3 已采纳 2017-07-26 17:42:44

解决方案2
2 2017-07-26 17:42:12

解决方案3
2 2017-07-26 17:45:50

解决方案4
0 2017-07-26 18:16:08

Pandas Multiindex数据帧删除行

问题描述

4 个解决方案

解决方案1 3 已采纳 2017-07-26 17:42:44

解决方案2 2 2017-07-26 17:42:12

解决方案3 2 2017-07-26 17:45:50

解决方案4 0 2017-07-26 18:16:08

解决方案1
3 已采纳 2017-07-26 17:42:44

解决方案2
2 2017-07-26 17:42:12

解决方案3
2 2017-07-26 17:45:50

解决方案4
0 2017-07-26 18:16:08