2

我的跨度标签包括:<span id="internal-source-marker_0.9510186333209276"><span>

我想要做的是将其转换为<span><span>

基本上,我想检查 span 是否有 id 值,然后将其完全删除。我完全不知道该怎么做。应该是正则表达式还是漂亮的汤?

正则表达式的问题是我不确定如何替换匹配的子字符串。

也许做一个漂亮的汤和正则表达式的组合?(不确定这是否是一个好的和有效的想法。)

4

1 回答 1

2

只需从attrib映射中删除属性;假设您<span>在局部变量中有对标记的引用span

if span.has_key('id'):
    del span['id']

演示:

>>> soup = BeautifulSoup('<span id="internal-source-marker_0.9510186333209276"></span>')
>>> span = soup.find('span')
>>> span
<span id="internal-source-marker_0.9510186333209276"></span>
>>> if span.has_key('id'):
...     del span['id']
... 
>>> span
<span></span>
于 2013-04-13T21:26:51.897 回答