我想从字符串中提取并打印一个变量号“-34.99”:
myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09"
字符串中的值将会改变。如何使用 Python 中的正则表达式来做到这一点?
提前致谢
非正则表达式解决方案是:
myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09"
print myString.split("/")[1]
在此处测试此代码。
正则表达式解决方案之一是:
import re
myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09"
print re.search(r'(?<=\/)[+-]?\d+(?:\.\d+)?', myString).group()
在此处测试此代码。
解释:
(?<=\/)[+-]?\d+(?:\.\d+)?
└──┬──┘└─┬─┘└┬┘└───┬────┘
│ │ │ │
│ │ │ └ optional period with one or more trailing digits
│ │ │
│ │ └ one or more digits
│ │
│ └ optional + or -
│
└ leading slash before match
对于这样的事情,re.findall 效果很好:
>>> import re
>>> myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09"
>>> re.findall(r'([+-]?\d+\.\d+)',myString)
['-35.00', '-34.99', '-34.00', '0.09']
您可以使用列表理解直接获取浮点数:
>>> [float(f) for f in re.findall(r'([+-]?\d+\.\d+)',myString)]
[-35.0, -34.99, -34.0, 0.09]
或者像这样的第二个:
>>> re.findall(r'([+-]?\d+\.\d+)',myString)[1]
'-34.99'
问题是您将接受多大范围的文本浮点数?有些没有小数点?指数?
>>> myString = "Test1 [cm]: -35.00/-34.99/-34.00/0.09/5/1.0e6/1e-6"
哎哟! - 使用正则表达式变得越来越难。
实际上,使用 Python 的字符串操作可能会更好:
>>> ''.join([s for s in myString.split() if '/' in s]).split('/')
['-35.00', '-34.99', '-34.00', '0.09', '5', '1.0e6', '1e-6']
您可以通过相同的方式获得第 n 个:
>>> n=2
>>> ''.join([s for s in myString.split() if '/' in s]).split('/')[n]
'-34.00'
然后所有奇怪的情况都可以在没有更难的正则表达式的情况下工作:
>>> map(float,''.join([s for s in myString.split() if '/' in s]).split('/'))
[-35.0, -34.99, -34.0, 0.09, 5.0, 1000000.0, 1e-06]