我一直在尝试仅匹配标签名称(没有<
and>
符号)是常规标签的情况:
<w:tag w:attrib1="http://url" w:attrib2="anyValue">
没有匹配的单独标签(开闭标签):
<w:tag2 w:attrib1="anyValue" w:attrib2="http://url" />
(请注意URL,因为它们包含正斜杠 ( /
))
但无法通过以下方式实现:
regex = re.compile('(?<=<)w:\w+(?=[\w\W]+>)(?!\s/>)')
print(regex.findall(string))
得到这个:
['w:tag','w:tag2']
期待这个:
['w:tag']
有什么想法吗?
干杯。