python - python - 如何在python中使用命名组和datadict从正则表达式模式组合字符串？

Question

简洁版本：

我想创建一个函数，用来自 datadict 的对应数据替换正则表达式中的所有命名组。例如：

Input: expr=r"/(?P<something>\w+)/whatever/(?P<something2>\w+)" data={"something":123, "something2": "thing"}
Output: "/123/whatever/thing"

但我不知道该怎么做。

一些附加信息：

我有代码迭代包含名称和模式的元组列表并尝试使用re.search。如果 re.search 匹配给定的字符串，它会从当前元组和 groupdict() （它是带有来自 re.search 的数据的字典）返回名称。

这是代码

class UrlResolver():
def __init__(self):
    self.urls = {}

def parse(self, app, url):
    for pattern in self.urls[app]:
        data = re.search(pattern[1], url)
        if data:
            return {"name": pattern[0], "data": data.groupdict()}

现在我想创建函数：

def compose(self, app, name, data):
    for pattern in self.url[app]:
        if pattern[0] == name:
            return string composed from regex expression and data from data dict.

上面的函数应该用来自 datadict 的对应数据替换所有命名组。

解决方案

使用 Hans Then 提供的答案（谢谢！）和其他一些信息是解决方案：

    def _group_replacer(data, match):
        data_key = match.group(1)
        return data[data_key]

    expression = r"\([^\(]*<([^<]*)>[^\(]*\)"
    expression = re.compile(expression)

    reversed = re.sub(expression, partial(_group_replacer, data), string)

函数“部分”可以从 functools 导入

score 5 · Accepted Answer

看看re.sub()功能。可以使用替换函数作为第二个参数调用此函数。请参阅http://docs.python.org/2/library/re.html

您必须自己定义该功能。它必须将匹配对象作为其参数。在其中，您应该查看匹配对象，提取匹配组并将其替换为字典中的值。

您可以通过循环遍历组并调用它们，从字符串中提取不需要从原始字符串中替换的文本。start, end = span(group)

编辑

我误读了你原来的问题。我现在看到您不想替换正则表达式中的匹配项，而是替换正则表达式本身。在这种情况下，困难的部分将是创建一个与命名正则表达式匹配的正则表达式。我的解决方案仍然成立，但可以稍微简单一些。

为了进行适当的忏悔，我创建了以下示例。

d = { 'something': 'completely',
      'something2': 'different' }

def repl(m):
    s = m.group(1)
    return d[s]

s = "/(?P<something>\w+)/whatever/(?P<something2>\w+)"
p = re.compile(r'\(\?P<(.*?)>\\w\+\)')

print p.sub(repl, s)

这将打印

/completely/whatever/different

score 1 · Accepted Answer

使用FJ here 演示的方法，您可以通过以下方式执行替换：

import re

data = {"something" : 123, "something2" : "thing"}
expr = r"/(?P<something>\w+)/whatever/(?P<something2>\w+)"

def matchsub(match, data):
    result = list(match.string)
    pat = match.re
    # print(pat)
    for key, index in pat.groupindex.items():
        # print(key, index, data[key], match.start(index), match.end(index))
        result[match.start(index):match.end(index)] = str(data[key])
    return ''.join(result)

result = matchsub(re.search(expr, "hi/ABC/whatever/DEF/there"), data)
print(result)

产量

hi/123/whatever/thing/there

python - python - 如何在python中使用命名组和datadict从正则表达式模式组合字符串？

解决方案

2 回答 2

Related

Reference