我正在处理 html 文件。我想提取第 2 项之前和第 1a 项之后的文本(感谢您的帮助)。首先,我删除第二项 2 之后的文本。
text= """"""<this is an example this is Item 2. A href="#106">Item 1a. thanks for helping <B>Item 2. Properties</B> this is an example this is Item 2.stachoverflow"""
>>> a=re.search ('(?<=<B>)Item 2\.',text)
>>> b = a.span()
>>> newText= text[:b[1]]
>>> c=newText.rfind("1a")
>>> (newText[c[1]:])
TypeError: 'int' object is not subscriptable
如何打印 c 之后的文本?