我正在处理一个包含第 1 项、第 2 项和第 3 项的 html 文件。我想删除最后一项 2 之后的所有文本。文件中可能有多个第 2 项。我正在使用它,但它不起作用:
text = """<A href="#106">Item 2. <B>Item 2. Properties</B> this is an example this is an example"""
>>> a=re.search ('(?<=<B>)Item 2.',text)
>>> b= a.group(0)
>>> newText= text.partition(b)[0]
>>> newText
'<A href="#106">'
它会删除第一项 2 而不是第二项之后的文本。