使用 portia (scrapy) 从网站中提取 Meta 标签
我想使用 portia 从某个网站中提取元标签,但它没有显示 head 标签,它仅从 body 标签开始
我只能从身体标签中提取数据
使用 portia (scrapy) 从网站中提取 Meta 标签
我想使用 portia 从某个网站中提取元标签,但它没有显示 head 标签,它仅从 body 标签开始
我只能从身体标签中提取数据
您需要在 中注释元素body,然后导航到head要映射的元素。
html元素。您将收到一条警告,说明您将丢失注释的任何映射属性,单击确定。head元素。head.+ Field按钮创建一个新字段,然后将所需的属性值映射到目标字段。您可以将其用于元名称:
meta_name = hxs.select('//meta/@name').extract()
这对于元内容:
meta_content = hxs.select('//meta/@content').extract()
这适用于具有特定名称(如描述)的元内容:
meta = hxs.select('//meta[@name=\'description\']/@content').extract()