2

我对 python 和正则表达式相当陌生,但我正在尝试找出一种方法来做到这一点。

我有一个看起来像这样的文件:

random text up here

group groupfoo {

    item_1
    item_2
    item_3
}

group groupbar {
    item_1
    item_2
    item_3
}

random text down here

在这个文件中有几个这样的组。组名(groupfoo、groupbar 等)都是唯一的。我希望能够以某种方式基于组名创建元组并将项目作为值。

请帮忙!

谢谢!

4

1 回答 1

2

这是一种没有正则表达式的方法。replace尽管您可能希望在下面的调用中使用正则表达式。但是,如果您的格式与您在问题中显示的一样严格,那么这将起作用。简单(非常简单)的状态机。

import collections

grouper = collections.defaultdict(list)
with open("groups.txt") as groups:
    in_group = False
    for line in groups:
        if '{' in line:
            in_group = True
            group_name = line.replace('group ', '').replace(' {', '').strip()
            continue
        if '}' in line:
            in_group = False
        if in_group:
            grouper[group_name].append(line.strip())
print grouper

输出

defaultdict(<type 'list'>, {'groupbar': ['item_1', 'item_2', 'item_3'], 'groupfoo': ['item_1', 'item_2', 'item_3']})
于 2013-03-22T23:24:39.903 回答