繁体   English   中英

如何使 pandas str.contains 更快

[英]How to make pandas str.contains faster

如何使 python 循环更快地通过具有 100 万行的 DataFrame 列并搜索字符串模式? 应该返回 True 或 False

pattern_example = "home|property|house|apartment"

这就是我现在所拥有的

df[field].str.contains(pattern_example.lower(), case = False, regex=False)

这就是我想要实现的

df[field].apply(lambda x: True if pattern_example.lower() in x else False)

但是,它无法识别 OR(|) 运算符和完整的“home|property|house|apartment”搜索器

有什么建议么?

@furas 感谢您的贡献。 有效。

这是我用的

df[field].apply(lambda x: True if any (word in x for word in pattern.lower().split('|')) else False)

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM