如何在python中使用命名組和datadict從正則表達式模式組成字符串？

Question

精簡版：

我想創建一個函數，它用正則表達式中的所有命名組替換來自datadict的相應數據。 例如：

Input: expr=r"/(?P<something>\w+)/whatever/(?P<something2>\w+)" data={"something":123, "something2": "thing"}
Output: "/123/whatever/thing"

但我不知道該怎么做。

一些附加信息：

我有代碼，它迭代包含名稱和模式的元組列表，並嘗試使用re.search。 如果re.search匹配給定字符串，則返回當前元組和groupdict（）的名稱（這是來自re.search的數據的dict）。

這是代碼

class UrlResolver():
def __init__(self):
    self.urls = {}

def parse(self, app, url):
    for pattern in self.urls[app]:
        data = re.search(pattern[1], url)
        if data:
            return {"name": pattern[0], "data": data.groupdict()}

現在我想創建功能：

def compose(self, app, name, data):
    for pattern in self.url[app]:
        if pattern[0] == name:
            return string composed from regex expression and data from data dict.

上面的函數應該用來自datadict的相應數據替換所有命名組。

解

使用Hans Then提供的答案（謝謝！）以及其他一些信息是解決方案：

    def _group_replacer(data, match):
        data_key = match.group(1)
        return data[data_key]

    expression = r"\([^\(]*<([^<]*)>[^\(]*\)"
    expression = re.compile(expression)

    reversed = re.sub(expression, partial(_group_replacer, data), string)

函數“partial”可以從functools導入

Answer 1

看看re.sub()函數。 可以使用替換函數作為第二個參數調用此函數。 見http://docs.python.org/2/library/re.html

你必須自己定義的功能。 它必須將匹配對象作為其參數。 在其中，您應該查看匹配對象，提取匹配組並將其替換為字典中的值。

您可以提取，你不需要通過組循環，並呼吁從原來的字符串替換字符串文本start, end = span(group)在他們身上。

編輯

我誤讀了你原來的問題。 我現在看到你不希望從正則表達式替換匹配，而是正則表達式本身。 在這種情況下，困難的部分是創建一個匹配命名正則表達式的正則表達式。 我的解決方案仍然有效，但可能會更簡單一些。

為了做適當的懺悔，我創建了以下示例。

d = { 'something': 'completely',
      'something2': 'different' }

def repl(m):
    s = m.group(1)
    return d[s]

s = "/(?P<something>\w+)/whatever/(?P<something2>\w+)"
p = re.compile(r'\(\?P<(.*?)>\\w\+\)')

print p.sub(repl, s)

這將打印

/completely/whatever/different

Answer 2

使用FJ在此處演示的方法，您可以通過以下方式執行替換：

import re

data = {"something" : 123, "something2" : "thing"}
expr = r"/(?P<something>\w+)/whatever/(?P<something2>\w+)"

def matchsub(match, data):
    result = list(match.string)
    pat = match.re
    # print(pat)
    for key, index in pat.groupindex.items():
        # print(key, index, data[key], match.start(index), match.end(index))
        result[match.start(index):match.end(index)] = str(data[key])
    return ''.join(result)

result = matchsub(re.search(expr, "hi/ABC/whatever/DEF/there"), data)
print(result)

產量

hi/123/whatever/thing/there

如何在python中使用命名組和datadict從正則表達式模式組成字符串？

問題描述

解

2 個解決方案

解決方案1
5 已采納 2012-11-07 11:33:13

解決方案2
1 2012-11-07 13:32:19

如何在python中使用命名組和datadict從正則表達式模式組成字符串？

問題描述

解

2 個解決方案

解決方案1 5 已采納 2012-11-07 11:33:13

解決方案2 1 2012-11-07 13:32:19

解決方案1
5 已采納 2012-11-07 11:33:13

解決方案2
1 2012-11-07 13:32:19