繁体   English   中英

Python Pandas - 无法识别另一个数据帧列中的列的字符串

[英]Python Pandas - Cannot recognize a string from a column in another dataframe column

我有一个包含以下数据的数据框:

在此输入图像描述

现在我正在尝试使用isIn方法,以便在col_a位于col_b中时生成带有结果的新列。在这种情况下,我试图生成以下输出:

在此输入图像描述

为此,我使用此代码:

df['res'] = df.col_a.isin(df.col_b)

但它总是返回FALSE。 我也尝试这个: df['res'] = df.col_b.isin(df.col_a)但结果相同......所有行都为FALSE。

我做错了什么?

谢谢!

您可以通过apply检查col_a中的值是否在每行的col_b

df['res'] = df.apply(lambda x: x.col_a in x.col_b, axis=1)

或者通过列表理解:

df['res'] = [a in b for a, b in zip(df.col_a, df.col_b)]

编辑:错误显然意味着缺少值,所以if-else语句是必要的:

df = pd.DataFrame({'col_a':['SQL','Java','C#', np.nan, 'Python', np.nan],
                   'col_b':['I.like_SQL_since_i_used_to_ETL',
                            'I like_programming_SQL.too',
                            'I prefer Java',
                            'I like beer',
                             np.nan,
                             np.nan]})
print (df)

df['res'] = df.apply(lambda x: x.col_a in x.col_b 
                               if (x.col_a == x.col_a) and (x.col_b == x.col_b) 
                               else False, axis=1)

df['res1'] = [a in b if (a == a) and (b == b) else False for a, b in zip(df.col_a, df.col_b)]
print (df)
    col_a                           col_b    res   res1
0     SQL  I.like_SQL_since_i_used_to_ETL   True   True
1    Java      I like_programming_SQL.too  False  False
2      C#                   I prefer Java  False  False
3     NaN                     I like beer  False  False
4  Python                             NaN  False  False
5     NaN                             NaN  False  False

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM