我的跨度标签包括:<span id="internal-source-marker_0.9510186333209276"><span>
我想要做的是将其转换为<span><span>
基本上,我想检查 span 是否有 id 值,然后将其完全删除。我完全不知道该怎么做。应该是正则表达式还是漂亮的汤?
正则表达式的问题是我不确定如何替换匹配的子字符串。
也许做一个漂亮的汤和正则表达式的组合?(不确定这是否是一个好的和有效的想法。)
我的跨度标签包括:<span id="internal-source-marker_0.9510186333209276"><span>
我想要做的是将其转换为<span><span>
基本上,我想检查 span 是否有 id 值,然后将其完全删除。我完全不知道该怎么做。应该是正则表达式还是漂亮的汤?
正则表达式的问题是我不确定如何替换匹配的子字符串。
也许做一个漂亮的汤和正则表达式的组合?(不确定这是否是一个好的和有效的想法。)
只需从attrib
映射中删除属性;假设您<span>
在局部变量中有对标记的引用span
:
if span.has_key('id'):
del span['id']
演示:
>>> soup = BeautifulSoup('<span id="internal-source-marker_0.9510186333209276"></span>')
>>> span = soup.find('span')
>>> span
<span id="internal-source-marker_0.9510186333209276"></span>
>>> if span.has_key('id'):
... del span['id']
...
>>> span
<span></span>