我试图从宜家网站上提取一些价格,但价格格式非常混乱(空格、回车、中间的逗号)。这是我提取的:
39,90 €
,
我使用 Scrapy 来做到这一点,到目前为止没问题,除了我想摆脱所有不是价格(和欧元符号)的东西!
我尝试使用这个正则表达式(在 python 2.7 中):
re(\S[0-9]+([ ,]?[ ])([0-9]{2}?)u"\u20AC")
我是编程新手,今天下午我学会了正则表达式,但我尝试了很多可能性,但没有得到比以下更好的结果:
SyntaxError: unexpected character after line continuation character
如果有人可以花几分钟时间看看我做了什么并告诉我哪里错了,那就太好了!
大家干杯