我有一堆要处理的html。我想删除我拥有的后半部分标签。基本上我从:
</div></div><div class="_3o-d" id="education
并希望以:
</div></div>
我试过:
workSection = re.split('<.*?$',workSection)[0]
但这与第一个 '<' 匹配,并给我留下了一个空字符串。有没有办法只匹配最后一个实例?还是以某种方式从头开始?
我也知道,拆分然后采取第一个选项可能不是最好的方法,我现在准备为此挨打。