我想从设置了背景属性的 html 文档中获取标签列表。
例如:
html="<div>
<div></div>
<table background=\"anything\">
</table>
</div>"
soup = BeautifulSoup(html)
result = soup.findall(??)
在这种情况下,我希望表格标签出现在列表中。请注意,“任何东西”的值可以是……任何东西。理想情况下,我想根据正则表达式过滤背景属性的值。
我的问题是:我可以使用 Beautiful Soup 来获取根据背景属性的值是否设置过滤的列表吗?更好的是,我可以一步基于应用于属性的正则表达式进行过滤吗?