[英]Using a variable within a regular expression in Pandas str.contains()
我正在尝试使用 pandas str.contains()
函数和包含变量的正则表达式从数据框中选择行,如下所示。
df = pd.DataFrame(["A test Case","Another Testing Case"], columns=list("A"))
variable = "test"
df[df["A"].str.contains(r'\b' + variable + '\b', regex=True, case=False)] #Returns nothing
虽然上面没有返回任何内容,但下面按预期返回适当的行
df[df["A"].str.contains(r'\btest\b', regex=True, case=False)] #Returns values as expected
任何帮助,将不胜感激。
两个单词边界字符都必须在原始字符串内。 为什么不使用某种字符串格式呢? 通常不建议使用字符串连接。
df[df["A"].str.contains(fr'\b{variable}\b', regex=True, case=False)]
# Or,
# df[df["A"].str.contains(r'\b{}\b'.format(variable), regex=True, case=False)]
A
0 A test Case
将“变量”解析为str.contains(variable)时,我遇到了完全相同的问题。
尝试使用str.contains(variable,regex = False)
它对我来说很完美。
以下命令对我有用:
df.query('text.str.contains(@variable)')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.