正则表达式+ Python从制表符分隔文件的值中删除特定的尾随和结束字符

Question

自完成任何正则表达式以来已经有好几年了，所以在这里寻求专家的帮助，因为这可能是一件微不足道的练习:)

我有一个制表符分隔的文件，并且在每一行上都有某些字段，其值如下：

FOO
酒吧
b“ foo的酒吧”
b'bar foo'
b'carbar”

（文件中的完整行可能类似于：

123 \\ t b'bar foo' \\ tabc \\ t123 \\ r \\ n

我想摆脱每一行中该字段的所有前导b'，b”和尾随“，'。 因此，鉴于上面的示例行，在运行正则表达式后，我将得到：

123 \\ t bar foo \\ tabc \\ t123 \\ r \\ n

如果您可以给我python blurb以便在文件上运行它，将获得加分。

Answer 1

（^ | \\ t）b [\\“']应该与前导符匹配，对于尾随符：

\\“'应该做

在Python中，您可以执行以下操作：

import re
r1 = re.compile("(^|\t)b[\"']")
r2 = re.compile("[\"'](\t|$)")

然后就用

r1.sub("\\1", yourString)
r2.sub("\\1", yourString)

Answer 2

您可以使用的每一行

re.sub(r'''(?<![^\t\n])\W*b(["'])(.*)\1\W*(?![^\t\n])''', r'\2', line)

对于奖励积分：

import re

pattern = re.compile(r'''(?<![^\t\n])\W*b(["'])(.*?)\1\W*?(?![^\t\n])''')
with open('outfile', 'w') as outfile:
    for line in open('infile'):
        outfile.write(pattern.sub(r'\2', line))

Answer 3

>>> "b\"foo's bar\"".replace('b"',"").replace("b'","").rstrip("\"'")
"foo's bar"
>>> "b'bar foo'".replace('b"',"").replace("b'","").rstrip("\"'")
'bar foo'
>>>

正则表达式+ Python从制表符分隔文件的值中删除特定的尾随和结束字符

问题描述

3 个解决方案

解决方案1
1 2010-03-05 22:57:53

解决方案2
1 已采纳 2010-03-05 23:05:37

解决方案3
0 2010-03-06 00:28:14

正则表达式+ Python从制表符分隔文件的值中删除特定的尾随和结束字符

问题描述

3 个解决方案

解决方案1 1 2010-03-05 22:57:53

解决方案2 1 已采纳 2010-03-05 23:05:37

解决方案3 0 2010-03-06 00:28:14

解决方案1
1 2010-03-05 22:57:53

解决方案2
1 已采纳 2010-03-05 23:05:37

解决方案3
0 2010-03-06 00:28:14