基于列值的熊猫子集和放置行

Question

my df: 我的df：

dframe = pd.DataFrame({"A":list("aaaabbbbccc"), "C":range(1,12)},  index=range(1,12))

Out[9]: 
    A   C
1   a   1
2   a   2
3   a   3
4   a   4
5   b   5
6   b   6
7   b   7
8   b   8
9   c   9
10  c  10
11  c  11

to subset based on column value: 到基于列值的子集：

In[11]: first = dframe.loc[dframe["A"] == 'a']
In[12]: first
Out[12]: 
   A  C
1  a  1
2  a  2
3  a  3
4  a  4

To drop based on column value: 要基于列值删除：

In[16]: dframe = dframe[dframe["A"] != 'a']
In[17]: dframe
Out[16]: 
    A   C
5   b   5
6   b   6
7   b   7
8   b   8
9   c   9
10  c  10
11  c  11

Is there any way to do both in one shot? 有什么办法可以一口气做到这两者吗？ Like subsetting rows based on a column value and deleting same rows in the original df. 就像基于列值设置行子集并删除原始df中的相同行一样。

Answer 1

It's not really in one shot, but typically the way to do this is reuse a boolean mask, like this: 这不是真的，但是通常这样做的方法是重用布尔型掩码，如下所示：

In [28]: mask = dframe['A'] == 'a'

In [29]: first, dframe = dframe[mask], dframe[~mask]

In [30]: first
Out[30]:
   A  C
1  a  1
2  a  2
3  a  3
4  a  4

In [31]: dframe
Out[31]:
    A   C
5   b   5
6   b   6
7   b   7
8   b   8
9   c   9
10  c  10
11  c  11

Answer 2

You can also use drop() 您也可以使用drop（）

dframe = dframe.drop(dframe.index[dframe.A == 'a'])

Output: 输出：

If you want to fix the index , you can do this. 如果要修复index ，可以执行此操作。

dframe.index = range(len(dframe))

Output: 输出：

Answer 3

An alternate way to think about it. 思考它的另一种方法。

gb = dframe.groupby(dframe.A == 'a')
isa, nota = gb.get_group(True), gb.get_group(False)

基于列值的熊猫子集和放置行

问题描述

3 个解决方案

解决方案1
3 已采纳 2016-06-19 22:54:35

解决方案2
2 2016-06-19 23:14:51

解决方案3
0 2016-06-20 00:05:32

基于列值的熊猫子集和放置行

问题描述

3 个解决方案

解决方案1 3 已采纳 2016-06-19 22:54:35

解决方案2 2 2016-06-19 23:14:51

解决方案3 0 2016-06-20 00:05:32

解决方案1
3 已采纳 2016-06-19 22:54:35

解决方案2
2 2016-06-19 23:14:51

解决方案3
0 2016-06-20 00:05:32