0

我想BeautifulSoup在 html 页面中找到具有特定类的所有元素。但他们也可以有额外的课程。例如:

soup.findAll('tr', {'class': 'super_class1'})

此代码仅查找trwho have only super_class1。但我希望它找到所有tr包含此类的人

<tr class='super_class1'>aaa</tr>

<tr class='super_class1 super_class2'>bbb</tr>

<tr class='super_class1 super_class15  super_class16'>ccc</tr>
4

1 回答 1

1

这是一个已修复的错误(https://bugs.launchpad.net/beautifulsoup/+bug/410304);问题基本上是汤不能识别类名中的空格。

但是如果你必须使用没有修复的版本,上面的链接也提供了一个解决方案:

soup.findAll(True, {'class': re.compile(r'\bsuper_class1\b')})
于 2013-05-04T07:00:32.877 回答