2

我试图从包含 CSS 和 HTML 的网页中解析和提取一些信息。我为此使用 cssutils 和 beatifulsoup。假设我想找出用于表格标题的字体大小。Beautifulsoup 告诉我表格定义在 HTML 中的位置。但是,如果我想知道表格中使用了哪种样式,我是否可以从 BeatifulSoup 获得该信息?如果不是,我该如何解决这个问题。谢谢你的帮助。

4

1 回答 1

0

是的,你明白了。BeautifulSoup是完美的选择,正则表达式的强大功能:)

例子:

import re
from BeautifulSoup import BeautifulSoup


soup = BeautifulSoup('<h1 style="font-size: 12px; margin: 5px">Test</h>')
style = soup.find('h1')['style']
re.findall('font-size[^;]+', style)
# [u'font-size: 12px']
于 2013-07-03T22:12:29.853 回答