熊猫如何切片多索引数据框？

Question

           name                     address             contact_info    
        first_name  last_name       stret   city    mobile      email
    1   AAA             BBB         XXX     YYY     02020       aaa@xyz.com
    2   111             222         333     444     239393      bbb@xyz.com

我在上述格式下有一个优秀的表现。 我想要的是将每个列都包含在名称中 ，然后只有contact_info内的移动列将有人告诉我如何做到这一点。 以下代码为我提供了name和contact_info中的所有内容

import pandas as pd
df = pd.read_excel("test.xlsx", header=[0, 1], sheet_name="Mapping")
print df[["name", "contact_info"]]

我正在尝试得到这样的东西，

first_name  last_name   mobile
AAA         BBB        102020
111         222        239393

Answer 1

您可以在此处使用df.xs ：

i = df.xs('name', axis=1)
j = df.xs('mobile', axis=1, level=-1)

pd.concat([i, j], axis=1)

  first_name last_name  contact_info
1        AAA       BBB          2020
2        111       222        239393

Answer 2

通过使用IndexSlice + concat

idx = pd.IndexSlice
pd.concat([df.loc[:, idx['name',:]],df.loc[:,idx[:,'mobile']]])
Out[104]: 
   contact_info       name          
         mobile first_name last_name
1           NaN        AAA       BBB
2           NaN        111       222
1          2020        NaN       NaN
2        239393        NaN       NaN

Answer 3

选项1
我想到的最简单的方法是列切片：

df['name'].join(df['contact_info']['mobile'])

  first_name last_name  mobile
1        AAA       BBB  020202
2        111       222  239393

选项2
pd.DataFrame.filter

df.filter(regex='name|mobile')

        name           contact_info
  first_name last_name       mobile
1        AAA       BBB       020202
2        111       222       239393

我们可以降低水平

d = df.filter(regex='name|mobile')
d.columns = d.columns.droplevel(0)
d

  first_name last_name  mobile
1        AAA       BBB  020202
2        111       222  239393

Answer 4

您要查找的内容只需要对multiindex和concat进行基本索引。 这是一个例子：

df = pd.read_excel("multi-index-test.xlsx", header=[0, 1])
df1 = df[["name"]]
df2 = df['contact_info', 'mobile']
pd.concat([df1, df2], axis=1)

我认为此解决方案的好处是1）简单，2）通用。

Answer 5

不知道为什么要避免concat，但这可以做到：

df = pd.read_excel("multi-index-test.xlsx", header=[0, 1], sheet_name="Mapping")
df.drop('address', level=0, axis=1).drop('e-mail', level=1, axis=1)

这利用了MultiIndex.drop（）的优势。

熊猫如何切片多索引数据框？

问题描述

5 个解决方案

解决方案1
3 2018-02-18 00:07:39

解决方案2
2 2018-02-18 00:02:44

解决方案3
2 2018-02-18 01:22:17

解决方案4
0 2018-02-18 00:18:46

解决方案5
0 已采纳 2018-02-18 00:43:41

熊猫如何切片多索引数据框？

问题描述

5 个解决方案

解决方案1 3 2018-02-18 00:07:39

解决方案2 2 2018-02-18 00:02:44

解决方案3 2 2018-02-18 01:22:17

解决方案4 0 2018-02-18 00:18:46

解决方案5 0 已采纳 2018-02-18 00:43:41

解决方案1
3 2018-02-18 00:07:39

解决方案2
2 2018-02-18 00:02:44

解决方案3
2 2018-02-18 01:22:17

解决方案4
0 2018-02-18 00:18:46

解决方案5
0 已采纳 2018-02-18 00:43:41