2

给定以下字符串;

....00.3276021,,,constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00...

如何提取 和 的值constString1constString2以便将它们分配给变量。例如:

string1_cummulativeTotal += [the magic returning the int]
string2_cummulativeTotal += [the magic returning the int]

谢谢!

4

4 回答 4

8
In [1]: import re

In [2]: s = '....00.3276021,,,constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00...'

In [3]: re.search('constString1=(\d+);', s).group(1)
Out[3]: '31'

In [4]: re.search('constString2=(\d+);', s).group(1)
Out[4]: '16'

这些仍然是字符串,不要忘记将它们转换为整数。

于 2012-12-06T14:57:07.930 回答
6

你可以在没有正则表达式的情况下做到这一点。

def get_sub(s, start, end):
    s1 = s[s.find(start) + len(start):]
    return s1[:s1.find(end)]

get_sub(s, "constString1=", ";")
>>> '31'

get_sub(s, "constString2=", ";")
>>> '16'

如果您想将其转换为另一种类型,您可以执行以下操作:

def get_sub(s, start, end, cast_to):
    s1 = s[s.find(start) + len(start):]
    return cast_to(s1[:s1.find(end)])

get_sub(s,"constString1=",";", int)
>>> 31

get_sub(s,"constString2=",";", float)
>>> 16.0

编辑

这种方法实际上比正则表达式更快:

t1 = timeit.Timer(stmt="""get_sub(s,"constString1=",";", int)""", setup="""s = "....00.3276021,,,constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00..."
def get_sub(s, start, end, cast_to):
    s1 = s[s.find(start) + len(start):]
    return cast_to(s1[:s1.find(end)])""")

t2 = timeit.Timer(stmt="""int(re.search("constString1=(\d+);",s).group(1))""", setup="""import re
s = "....00.3276021,,,constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00..."
""")

>>> t1.timeit()
2.829952681655172

>>> t2.timeit()
3.7208872074169506
于 2012-12-06T15:07:40.527 回答
2

除了其他答案中提到的正则表达式方法之外,如果单独的项目由分号分隔,您可以使用如下代码,使用split(';')and :split('=')

s='....00.3276021,,,;constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00...'
string1_subtotal = string2_subtotal = 0
for ss in s.split(';'):
    a = ss.split('=')
    if a[0]=='constString1': string1_subtotal += int(a[1])
    if a[0]=='constString2': string2_subtotal += int(a[1])
于 2012-12-06T15:16:55.810 回答
-1

为什么不一口气做完呢?

>>> import re
>>> s = "....00.3276021,,,constString1=31;garbage=00:00:00.0090000;constString2=16;garbage2=00.00..."
>>> ms = re.match(r'.*constString1=(\d+);.*constString2=(\d+);', s)
>>> ms.groups() #just to show you. you wont need to do this on your code...
('31', '16') 
>>> string1_cummulativeTotal += ms.group(1)
>>> string2_cummulativeTotal += ms.group(2)

注意:这只有在contString's 的顺序正确时才有效 (1,2....)

于 2012-12-06T15:07:13.767 回答