[英]How to make pandas str.contains faster
如何使 python 循环更快地通过具有 100 万行的 DataFrame 列并搜索字符串模式? 应该返回 True 或 False
pattern_example = "home|property|house|apartment"
这就是我现在所拥有的
df[field].str.contains(pattern_example.lower(), case = False, regex=False)
这就是我想要实现的
df[field].apply(lambda x: True if pattern_example.lower() in x else False)
但是,它无法识别 OR(|) 运算符和完整的“home|property|house|apartment”搜索器
有什么建议么?
@furas 感谢您的贡献。 有效。
这是我用的
df[field].apply(lambda x: True if any (word in x for word in pattern.lower().split('|')) else False)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.