我需要在文本文档中查找价格。我的代码如下所示:
sentence = "This is test text $25,000 $25,000$20,000 $30"
pattern = re.compile(ur'[$€£]?\d+([.,]\d+)?', re.UNICODE | re.MULTILINE | re.DOTALL)
print pattern.findall(sentence)
期望的结果是:
['$25,000', '$30']
我不需要在结果中包含 $25,000$20,000,因为这不是我的任务的有效结果。我只需要完整的单词匹配。
但我得到了这个结果:
['$25,000', '$25,000', '$20,000', '$30']
如何重写我的正则表达式以仅包含由空格或标点符号分隔的价格?