1

我想对上一个问题中的一些代码进行一些改进:

// the new base url
var base = ' https://www.example.co.uk/gp/wine/order?ie=UTF8&asin=';
var links  = document.getElementsByTagName('a');

for(var i = 0;i < links.length;i++){
    // check each link for the 'asin' value
    var result = /asin=([\d\w]+)/.exec(links[i].getAttribute('href'));
    if(result){
        // make a new url using the 'base' and the 'asin' value
        links[i].setAttribute('href', base+result[1]);
    }
}

现在,我可以让它只查看来自图像的链接,而不是作用于所有链接吗?

这是一个 HTML 片段来说明我的意思:

<a href="/shop/product?ie=UTF8&amp;asin=Z00FDLN878&amp;tab=UK_Default" target="_blank"><img width="125" height="125" border="0" src="http://ecx.images-amazon.com/images/I/01W9a7gwosL.jpg" alt="43453"></a>

那是一个图片链接——我确实希望它对此采取行动。

不可能的?

我的直觉是,这在代码中实际上是不可能的——因为document.getElementsByTagName('a')看不到文本链接和图像链接之间的区别。

4

7 回答 7

2

使用querySelectorAll仅预选正确种类的节点。例如:

// the new base url
var base        = 'https://www.example.co.uk/gp/wine/order?ie=UTF8&asin=';
var linkImgs    = document.querySelectorAll ("a > img");

for (var J = linkImgs.length - 1;  J >= 0;  --J) {
    var imgLink = linkImgs[J].parentNode;

    //--- Check each link for the 'asin' value
    var result  = /asin=([\d\w]+)/.exec (imgLink.getAttribute ('href') );
    if( result) {
        // make a new url using the 'base' and the 'asin' value
        imgLink.setAttribute ('href', base+result[1]);
    }
}
于 2013-11-28T00:19:35.160 回答
1

您可以只测试一个 IMG 孩子,如果有一个链接,则只处理该链接。

JSFiddle 上的示例

// the new base url
var base = ' https://www.example.co.uk/gp/wine/order?ie=UTF8&asin=';
var links  = document.getElementsByTagName('a');

for(var i = 0;i < links.length;i++){
    var linkElement = links[i];
    //get the first child of the a element
    var firstChild = linkElement.children[0];
    //if there is a child and it's an IMG then process this link
    if (typeof(firstChild) !== "undefined" && firstChild.tagName=="IMG") { 
      // check each link for the 'asin' value
      var result = /asin=([\d\w]+)/.exec(links[i].getAttribute('href'));
      if(result){
          // make a new url using the 'base' and the 'asin' value
          links[i].setAttribute('href', base+result[1]);
      }}
}
于 2013-11-27T23:52:35.367 回答
1

您可以使用正则表达式来检查链接的 HTML 中的链接:

for(var i = 0;i < links.length;i++) {

    // check each link for the 'asin' value
    var result = /asin=([\d\w]+)/.exec(links[i].getAttribute('href'));

    // check each link for an img tag
    var hasimage = /<img [^>]+>/.test(links[i].innerHTML);

    if(result && hasimage){
        // make a new url using the 'base' and the 'asin' value
        links[i].setAttribute('href', base+result[1]);
    }

}

此外,使用正则表达式搜索 HTML 可能不是最好的选择,但如果您控制生成的内容,那么这可能是没有 3rd 方 html 解析器的最快方法。

于 2013-11-27T23:26:56.153 回答
1

您可以根据链接是否包含图像来过滤链接。

var links  = document.getElementsByTagName('a');

links = [].filter.call(links, function(item) {
   // test to see if child node is an image
   return item.childNodes[0].nodeName === 'IMG'; 
});

for(var i = 0;i < links.length;i++){
    // do what you gotta do
}
于 2013-11-27T23:30:14.127 回答
0
// the new base url
var base = ' https://www.example.co.uk/gp/wine/order?ie=UTF8&asin=';
var links  = document.getElementsByTagName('img');
var hrefs = links.parent;

for(var i = 0;i < hrefs.length;i++){
    // check each link for the 'asin' value
    var result = /asin=([\d\w]+)/.exec(hrefs[i].getAttribute('href'));
    if(result){
        // make a new url using the 'base' and the 'asin' value
        hrefs[i].setAttribute('href', base+result[1]);
    }
}
于 2013-11-27T23:25:43.337 回答
0

有一个链接集合,您可以检查链接是否有图像子节点:

var link, links = document.links;
var re = /asin=([\d\w]+)/;
for (var i=0, iLen=links.length; i<iLen; i++) {
  link = links[i]

  if (link.getElementsByTagName('img').length && re.test(link.href)) {
    link.href = base + result[1];
  }
}
于 2013-11-27T23:40:48.243 回答
-1

我最初的反应是查看查询全选,然后分配一个类名来抓取所有会受到您尝试做的任何事情影响的 a 标签。当我拿到我的笔记本电脑时,我会用一个例子来编辑它。

于 2013-11-27T23:45:13.447 回答