在 Pandas str.contains() 中使用正则表达式中的变量

Question

我正在尝试使用 pandas str.contains()函数和包含变量的正则表达式从数据框中选择行，如下所示。

df = pd.DataFrame(["A test Case","Another Testing Case"], columns=list("A"))
variable = "test"
df[df["A"].str.contains(r'\b' + variable + '\b', regex=True, case=False)] #Returns nothing

虽然上面没有返回任何内容，但下面按预期返回适当的行

df[df["A"].str.contains(r'\btest\b', regex=True, case=False)] #Returns values as expected

任何帮助，将不胜感激。

Answer 1

两个单词边界字符都必须在原始字符串内。 为什么不使用某种字符串格式呢？ 通常不建议使用字符串连接。

df[df["A"].str.contains(fr'\b{variable}\b', regex=True, case=False)] 
# Or, 
# df[df["A"].str.contains(r'\b{}\b'.format(variable), regex=True, case=False)] 

             A
0  A test Case

Answer 2

将“变量”解析为str.contains（variable）时，我遇到了完全相同的问题。

尝试使用str.contains（variable，regex = False）

它对我来说很完美。

Answer 3

以下命令对我有用：
df.query('text.str.contains(@variable)')

在 Pandas str.contains() 中使用正则表达式中的变量

问题描述

3 个解决方案

解决方案1
4 已采纳 2018-12-04 22:05:57

解决方案2
0 2019-07-25 16:33:24

解决方案3
0 2021-05-04 14:25:38

在 Pandas str.contains() 中使用正则表达式中的变量

问题描述

3 个解决方案

解决方案1 4 已采纳 2018-12-04 22:05:57

解决方案2 0 2019-07-25 16:33:24

解决方案3 0 2021-05-04 14:25:38

解决方案1
4 已采纳 2018-12-04 22:05:57

解决方案2
0 2019-07-25 16:33:24

解决方案3
0 2021-05-04 14:25:38