我正在使用 lxml 解析一个 html,该 html 具有如下所示的 facebook 评论标签:
<fb:comments id="fb_comments" href="http://example.com" num_posts="5" width="600"></fb:comments>
我正在尝试选择它来获取 href 值,但是当我这样做时,cssselect('fb:comments')
我收到以下错误:
The pseudo-class Symbol(u'comments', 3) is unknown
有没有办法做到这一点?
编辑: 代码:
from lxml.html import fromstring
html = '...'
parser = fromstring(html)
parser.cssselect('fb:comments') #raises the exception