嘿,我有一个 html 页面,其中包含例如以下标签:
<p foruri="http://doc.scrapy.org/getting-help:solving-specific-problems" rec="lang.en" id="solving-specific-problems">Hello world!!! From my authoring tool.</p>
<p foruri="http://doc.scrapy.org/getting-help:getting help" rec="lang.en" id="getting help">Hello world!!! From my authoring tool.</p>
现在我使用 python 中的 scrapy 框架编写了一个爬虫,在其中我使用 cxxpath 查询来查找 foruri 标签,因为//@foruri
它应该给我foruri
标签存在的地方,但问题是它不会产生 http:
所以帮我搞定?