我有一个字符串,我想提取其中的一个子集。这是一个更大的 Python 脚本的一部分。
这是字符串:
import re
htmlString = '</dd><dt> Fine, thank you. </dt><dd> Molt bé, gràcies. (<i>mohl behh, GRAH-syuhs</i>)'
我想抽出“ Molt bé, gràcies. mohl behh, GRAH-syuhs ”。为此,我使用正则表达式re.search
:
SearchStr = '(\<\/dd\>\<dt\>)+ ([\w+\,\.\s]+)([\&\#\d\;]+)(\<\/dt\>\<dd\>)+ ([\w\,\s\w\s\w\?\!\.]+) (\(\<i\>)([\w\s\,\-]+)(\<\/i\>\))'
Result = re.search(SearchStr, htmlString)
print Result.groups()
AttributeError: 'NoneType' object has no attribute 'groups'
由于Result.groups()
不起作用,我想做的提取(即Result.group(5)
和Result.group(7)
)也不起作用。但我不明白为什么我会收到这个错误?正则表达式在 TextWrangler 中有效,为什么在 Python 中无效?我是 Python 的初学者。