python - 从 python 中成功的正则表达式匹配构建字典

Question

我对 Python 很陌生，我正在尝试解析文件。文件中只有某些行包含感兴趣的数据，我想最终得到一个从文件中有效匹配行解析的内容的字典。

下面的代码有效，但它有点难看，我正在尝试学习它应该如何完成，也许是理解，或者使用多行正则表达式。我正在使用 Python 3.2。

file_data = open('x:\\path\\to\\file','r').readlines()
my_list = []
for line in file_data:
    # discard lines which don't match at all
    if re.search(pattern, line):
        # icky, repeating search!!
        one_tuple = re.search(pattern, line).group(3,2)
        my_list.append(one_tuple)
my_dict = dict(my_list)

你能建议一个更好的实现吗？

score 6 · Accepted Answer

感谢您的回复。把它们放在一起后，我得到了

file_data = open('x:\\path\\to\\file','r').read()
my_list = re.findall(pattern, file_data, re.MULTILINE)
my_dict = {c:b for a,b,c in my_list}

但我认为如果没有帮助，我今天不可能到达那里。

score 5 · Accepted Answer

这是对您的代码的一些快速优化：

my_dict = dict()

with open(r'x:\path\to\file', 'r') as data:
    for line in data:
        match = re.search(pattern, line)
        if match:
            one_tuple = match.group(3, 2)
            my_dict[one_tuple[0]] = one_tuple[1]

score 3 · Accepted Answer

本着EAFP的精神，我建议

with open(r'x:\path\to\file', 'r') as data:
    for line in data:
        try:
            m = re.search(pattern, line)
            my_dict[m.group(2)] = m.group(3)
        except AttributeError:
            pass

另一种方法是继续使用列表，但重新设计模式，使其仅包含两个组(key, value)。然后你可以简单地做：

  matches = [re.findall(pattern, line) for line in data]
  mydict = dict(x[0] for x in matches if x)

score 2 · Accepted Answer

2

matchRes = pattern.match(line)
if matchRes:
    my_dict = matchRes.groupdict()

于 2015-07-16T10:24:41.083 回答

score 1 · Accepted Answer

我不确定我是否会推荐它，但这是一种您可以尝试使用理解的方法（为简单起见，我用字符串替换了文件）

>>> import re
>>> data = """1foo bar
... 2bing baz
... 3spam eggs
... nomatch
... """
>>> pattern = r"(.)(\w+)\s(\w+)"
>>> {x[0]: x[1] for x in (m.group(3, 2) for m in (re.search(pattern, line) for line in data.splitlines()) if m)}
{'baz': 'bing', 'eggs': 'spam', 'bar': 'foo'}

python - 从 python 中成功的正则表达式匹配构建字典

5 回答 5

Related

Reference