![](/img/trans.png)
[英]How do I custom sort against a Pandas Dataframe's MultiIndex?
[英]In Python's Pandas, how do I filter a DataFrame on a Field in a MultiIndex
我有这个 DataFrame 有一个 MultiIndex 字段为Hi , Md , Lo
import pandas as pd
df = pd.DataFrame(
[
["A", "X", "C", "7", "3"],
["A", "B", "C", "7", "2"],
["A", "B", "C", "7", "1"],
["A", "X", "C", "7", "3"],
["1", "2", "3", "7", "3"],
["4", "5", "6", "7", "3"],
],
columns=["Hi", "Md", "Lo", "O", "I"],
).set_index(["Hi", "Md", "Lo"])
看起来像这样
O I
Hi Md Lo
A X C 7 3
B C 7 2
C 7 1
X C 7 3
1 2 3 7 3
4 5 6 7 3
如何设置过滤器以仅获取Md值为B的行
我尝试通过字段名称
df[df['Md'] == 'B']
这会引发 KeyError,因为“字段”不是列,而是 MultiIndex 的一部分
df[df.index.map(lambda x: x[1] == 'B')]
有效,但非常hacky。
是否有更短的方法来编写此过滤器,可能使用字段名称Md或索引 position 1 ?
您可以使用DataFrame.query
df.query("Md == 'B'")
Output
O I
Hi Md Lo
A B C 7 2
C 7 1
替代方案(可能不适用于不同的数据)
df.filter(like='B', axis=0)
这是一种将元组传递给df.loc
的方法
df.loc[(slice(None),'B',slice(None))]
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.