Python中拆分和转义的正斜杠

Question

我有一个文件，其中包含格式为/pattern/replace/ perl风格的正则表达式，我试图将其作为已编译模式及其相关替换字符串的列表读入Python。 以下是到目前为止我所做的。

def get_regex(filename):
    regex = []
    fi = open(filename,'r')
    text = [l for l in fi.readlines() if not l.startswith("#")]
    fi.close()
    for line in text:
        ptn, repl = line[1:].split('/')[:-1]
        regex.append((re.compile(ptn), repl))
    return regex

直到我进入带有转义的正斜杠的行之前，这都非常有效，如下所示：

/$/ <\\/a>/

当我尝试拆分此字符串时，Python返回三个元素的列表['$', ' <\\\\', 's>'] ，而不是（希望的） ['$', ' <\\\\/s>'] 。 有什么方法可以使replace解释转义符吗？

Answer 1

不是，不是 最好的选择可能是使用re.split() ，并使用正则表达式，该正则表达式使用向后查找以确保不会转义正斜杠，例如

UNESCAPED_SLASH_RE = re.compile(r'(?<!\\)/')
ptn, repl = UNESCAPED_SLASH_RE.split(line[1:])[:-1]

Python中拆分和转义的正斜杠

问题描述

1 个解决方案

解决方案1
3 已采纳 2011-10-10 20:20:23

Python中拆分和转义的正斜杠

问题描述

1 个解决方案

解决方案1 3 已采纳 2011-10-10 20:20:23

解决方案1
3 已采纳 2011-10-10 20:20:23