带有替换功能的 Python 替换

Question

我有一个包含一些 SQL 的文件，例如：

INSERT INTO table (ID, Name) VALUES (1, 'a');
INSERT INTO table (ID, Name) VALUES (2, 'b');
...
INSERT INTO table (ID, Name) VALUES (1000, 'all');

我想在文件中用 1000 增加所有ID值，以获得：

INSERT INTO table (ID, Name) VALUES (1001, 'a');
INSERT INTO table (ID, Name) VALUES (1002, 'b');
...
INSERT INTO table (ID, Name) VALUES (2000, 'all');

我写了以下 Python 代码

import os, re
root = r'path\to\dir'
path = os.path.join(root, 'original.sql')
new =  os.path.join(root, 'new.sql')

def increment(n, base=1000):
    return str(int(n.group(1)) + base)

with open(path) as f, open(new, 'w') as g:
    for line in f:
        line = re.sub('.*VALUES \((\d{1,4}),.*', increment, line)
        g.write(line)

但这只是输出增加的值而不是进行替换。 我究竟做错了什么？

Answer 1

将您的正则表达式更改为：

def fix_line(n, base=1000):
    return n.group(1) + str(int(n.group(2)) + base) + n.group(3)

line = re.sub('(.*VALUES \()(\d{1,4})(,.*)', fix_line, line)

所以如果你有line = "INSERT INTO table (ID, Name) VALUES (1001, 'a');" 开始，然后在您的正则表达式替换之后，您将拥有：

line = "INSERT INTO table (ID, Name) VALUES (2001, 'a');"

基本上，您需要捕获数字之前的内容和数字之后的内容，并将其包含在您对每一行的处理中。

我应该补充一点，您不需要.*在正则表达式的开头和结尾。 它也适用于line = re.sub('(VALUES \\()(\\d{1,4})(,)', fix_line, line)虽然这次你只匹配line一小部分，特别是VALUES (1001,然后仅在其上应用替换函数并保持字符串的其他部分不变。（您的原始正则表达式匹配整行并重新生成它。）。

你也可以这样做

def iterate_number(n, base=1000):
    return "VALUES (%d," % (int(n.group(1)) + base)

line = re.sub('VALUES \((\d{1,4}),', iterate_number, line)

它只有一个匹配的组（数字），并且只是在字符串处理中添加了VALUES (数字之前，和数字之后的逗号。

带有替换功能的 Python 替换

问题描述

1 个解决方案

解决方案1
2 已采纳 2014-04-08 07:55:36

带有替换功能的 Python 替换

问题描述

1 个解决方案

解决方案1 2 已采纳 2014-04-08 07:55:36

解决方案1
2 已采纳 2014-04-08 07:55:36