从节点,我想从外部网页获取所有图像 url(src
来自标签的属性)。img
我从考虑 phantonjs 开始,但不喜欢它没有真正集成到节点中(即它在外部进程中运行)。
接下来,我尝试使用请求模块和cheerio。这很好用,除了我必须处理相对图像 url。例如
<img src='http//example.com/i.jpg'>
<img src='/i.jpg'>
<img src='i.jpg'>
<img src='../images/i.jpg'>
我可以解决这个问题,但我想知道是否有更简单的方法?