1

我正在尝试从 beautifulsoup 结果中计算“汤”中的标签数量。我想使用正则表达式,但遇到了麻烦。我试过的代码如下:

reg_exp_tag = re.compile("<[^>*>")
tags = re.findall(reg_exp_tag, soup(cast as a string))

re不允许reg_exp_tag,给出正则表达式错误的意外结束。

任何帮助将非常感激!

谢谢

4

2 回答 2

4

如果你已经用 BeautifulSoup 解析了 HTML,为什么还要再解析它呢?试试这个:

num_tags = len(soup.findAll())
于 2009-11-08T20:27:24.870 回答
1

那不应该"<[^>]*>"代替"<[^>*>"吗?

(该类需要用 a 关闭]

于 2009-11-08T20:18:59.833 回答