0

我有一堆要处理的html。我想删除我拥有的后半部分标签。基本上我从:

</div></div><div class="_3o-d" id="education

并希望以:

</div></div>

我试过:

workSection = re.split('<.*?$',workSection)[0]

但这与第一个 '<' 匹配,并给我留下了一个空字符串。有没有办法只匹配最后一个实例?还是以某种方式从头开始?

我也知道,拆分然后采取第一个选项可能不是最好的方法,我现在准备为此挨打。

4

1 回答 1

1

只需使用[^<]而不是.

>>> re.split('<[^<]*$', '</div></div><div class="_3o-d" id="education')
['</div></div>', '']
于 2013-10-30T23:13:51.257 回答