使用 portia (scrapy) 从网站中提取 Meta 标签
我想使用 portia 从某个网站中提取元标签,但它没有显示 head 标签,它仅从 body 标签开始
我只能从身体标签中提取数据
使用 portia (scrapy) 从网站中提取 Meta 标签
我想使用 portia 从某个网站中提取元标签,但它没有显示 head 标签,它仅从 body 标签开始
我只能从身体标签中提取数据
您需要在 中注释元素body
,然后导航到head
要映射的元素。
html
元素。您将收到一条警告,说明您将丢失注释的任何映射属性,单击确定。head
元素。head
.+ Field
按钮创建一个新字段,然后将所需的属性值映射到目标字段。您可以将其用于元名称:
meta_name = hxs.select('//meta/@name').extract()
这对于元内容:
meta_content = hxs.select('//meta/@content').extract()
这适用于具有特定名称(如描述)的元内容:
meta = hxs.select('//meta[@name=\'description\']/@content').extract()