![](/img/trans.png)
[英]Boolean indexing in Pandas DataFrame with MultiIndex columns
[英]Pandas : Boolean indexing on multiple columns
我有如下数据框。
In [23]: data2 = [{'a': 'x', 'b': 'y','c':'q'}, {'a': 'x', 'b': 'p', 'c': 'q'}, {'a':'p', 'b':'q'},{'a':'q', 'b':'y','c':'q'}]
In [26]: df = pd.DataFrame(data2)
In [27]: df
Out[27]:
a b c
0 x y q
1 x p q
2 p q NaN
3 q y q
我想做布尔索引来过滤出具有x或y的列。 这是我做的
In [29]: df[df['a'].isin(['x','y']) | (df['b'].isin(['x','y']))]
Out[29]:
a b c
0 x y q
1 x p q
3 q y q
但是我有超过50列需要检查,并且检查每列似乎不是很pythonic。 我试过了
In [30]: df[df[['a','b']].isin(['x','y'])]
但是输出不是我期望的,我得到以下
Out[30]:
a b c
0 x y NaN
1 x NaN NaN
2 NaN NaN NaN
3 NaN y NaN
我可以删除全部为NaN的行,但其余的行中缺少这些值。
例如,在第0行中,c是NaN,但我需要该值。
有什么建议怎么做?
您可以将df与“ x”和“ y”进行比较,然后进行逻辑运算或查找具有“ x”或“ y”的行。 然后使用布尔数组作为索引来选择那些行。
df.loc[(df.eq('x') | df.eq('y')).any(1)]
Out[68]:
a b c
0 x y q
1 x p q
3 q y q
这有效:
df.loc[df.apply(lambda x: 'x' in list(x) or 'y' in list(x), axis=1)]
a b c
0 x y q
1 x p q
3 q y q
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.