我有这个代码
site = hxs.select("//h1[@class='state']")
mydata = site.select("string()").extract()
cleaned_mydata = re.sub(ur'(\s)\s+', ur'\1', mydata[0], flags=re.MULTILINE + re.UNICODE)
log.msg(str(mydata),level=log.ERROR)
log.msg(str(cleaned_mydata),level=log.ERROR)
第一个输出是
错误:[u'\r\n 212\r\n 作业在 xxxx 中包含 php \r\n ']
其他输出是
xxxxxx 中包含 php 的作业
正则表达式也212
用它剥离数字。我该如何解决