繁体   English   中英

如何根据列中的值更改条件的标准 - Pandas

[英]How to change the criteria of a condition based on values in a column - Pandas

我有以下问题,我无法找到正确的解决方案。

我有一个数据框。

在此处输入图片说明

仅当满足以下条件时,我才需要将 first_name 传递给另一个数据帧:

条件 #1 --> 如果 'id' 为 1,则仅当 'country' = US AND 'code' = 1 AND 'zip' = 3 时传递 'first_name'

条件 #2 --> 如果 'id' 为 2,则传递 'first_name' IF 'country' = US. (无需检查代码和邮编。无论代码和邮编如何,都通过 first_name)

因此,在此数据框中,根据上述条件,它只需要传递 - 'peter'、'mike' 和 'jenny'

我的代码看起来像:

filter1 = df['id']=='1'
filter2 = df['country'] ==1
filter3 = df['code']=='1'
filter4 = df['zip'] =='3'

#filtering data 
df.where(filter1 & filter2 & filter3 & filter4, inplace = True)

#then pass first_name

new_df['first_name'] = df['first_name']

但是通过这样做,我只能应用条件 (1) 或 (2)。

请帮忙。 谢谢!

使用boolean indexing| 对于bitwise OR链式过滤器,在DataFrame.loc按列first_name过滤:

#if numbers are not strings remove `''`
filter1 = df['id']==1
filter2 = df['country'] == 'US'
filter3 = df['code']==1
filter4 = df['zip'] ==3
filter5 = df['id']==2

s = df.loc[(filter1 & filter2 & filter3 & filter4) | (filter5 & filter2), 'first_name']
print (s)
1    peter
3     mike
4    jenny
Name: first_name, dtype: object

.loc与布尔掩码组合使用。

new_df = df.loc[
    ( # mask1
        df.id.eq(1) & df.country.eq('US') & df.code.eq(1) & df.zip.eq(3)
    )
        | # or
    ( # mask2
        df.id.eq(2) & df.country.eq('US')
    ),
    'first_name'
]

如果您使用.where而不是.loc与相同的布尔掩码,您将获得与df相同形状的数据帧,但被掩码为False每一行都将填充NaN

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM