2

我正在解析一个文件,并想在我的文件中找到任何位置<color = orange><color>开始位置。

然后我想拉出橙色的值。

我将如何使用正则表达式来做到这一点。

到目前为止,我有这个(这还不够,因为它不寻找颜色有值的情况):

def main():
    basefile = open ("base.txt")
    libfile = open ("file.txt")
    lines = []
    while 1:
        line = libfile.readline()
        lines.append("%s" % libfile.readline())
        if not line:
            break
    inlibrary = 0 
    newlibrary = []
    for line in lines:
        if "<color>" in line:
4

2 回答 2

0

如果您的问题是匹配的正则表达式,请查看它们:

>>> m = re.match("<color(?:\s*=\s*(.*?))?>", "<color>asdfsdaf")
>>> m, m.groups()
(<_sre.SRE_Match object at 0x7fb0579467b0>, (None,))
>>> m = re.match("<color(?:\s*=\s*(.*?))?>", "<color=fuschia>asdfsdaf")
>>> m, m.groups()
(<_sre.SRE_Match object at 0x7fb057946738>, ('fuschia',))
>>> m = re.match("<color(?:\s*=\s*(.*?))?>", "foobarbaz")
>>> m #None
>>>

但是你真的应该使用 XML 解析器来完成这项工作。

于 2013-02-28T19:24:06.080 回答
0

如果您不想使用完整的 XML 解析器,应该这样做:

import re
with open("file.txt") as libfile:
    lines_with_color = []
    for line in libfile.readlines():
       if re.match("<color(=[^>]+)?>", line):
           lines_with_color.append(line)
于 2013-02-28T19:24:45.720 回答