我正在 CasperJS 中构建一个链接刮板,主要功能看起来很像这样:
function findLinks() {
return Array.prototype.map.call(document.querySelectorAll('a'), function(e){
return {
href: e.href,
title: e.title,
rel: e.rel,
anchor: e.text,
innerHTML: e.innerHTML
};
});
}
但是,我想以findLinks()
某种方式进行修改,如果我的链接抓取工具发现这样的内容:
<a href="#" title="anchor tag" rel="nofollow"><img src="myimage.jpg" alt="beautiful image" /></a>
我可以<img>
单独访问属性,就像使用链接一样。
我一直在阅读 Mozilla MDN 和 CasperJS,但我还没有找到实现这一目标的方法,
任何帮助将不胜感激!