-1

我需要从下面的代码中提取“ https://www.somesite.com/Some.Name.123 ”。

该代码段重复了很多次,我需要 URL ..Some.Name.X。

我感兴趣的每个代码段之间还有其他代码段,周围的 html 非常不同。我不需要那些其他段中的 ..Some.Name.x URL。

以下是我需要的 URL 所独有的:"<a class="-cx-PRIVATE-uiImageBlock__image"

<div class="clearfix pvm">
<a class="-cx-PRIVATE-uiImageBlock__image -cx-PRIVATE-uiImageBlock__largeImage lfloat"
aria-hidden="true" tabindex="-1" href="https://www.somesite.com/Some.Name.123">
4

2 回答 2

1

我不知道如何用 iMacros 标记前面的 HTML,或者如何用 jQuery 来标记,因为每次结构都会有所不同,但你可以这样做。

使用 iMacros 保存网页。编写一个程序(c 等)来读取每个保存的文件,并将“cx-PRIVATE-uiImageBlock__image”后面的 URL 写入文件。将该 URL 列表添加到 iMacro,或让 iMacros 读取文件,然后处理来自 iMacro 的每个 URL。

于 2013-02-28T16:13:20.910 回答
0

您需要使用一些脚本。我的回答使用了 jQuery

var listoflinks = []; //array containing your links
$('a[href*="somesite.com"]').each(function () { // for each link that contains somesite.com in href
    var j = $(this).attr('href'); //put the whole href in a variable
    listoflinks.push(j); // put all values in an array
});

您最终会得到一个包含您要查找的所有 href 值的数组。

如果你想看一个例子和/或你想玩弄脚本,你可以去这里:http: //jsfiddle.net/flish/rESjg/

已编辑您的代码仍然不够清晰,但希望这可能会有所帮助

<a class="sibling a" href="link">sibling a</a><br />
<div class="sibling div"><br />
    <a class="child a" href="start-with-link/correct-link">Child a</a><br />
</div><br />

以上是我使用的标记。这意味着我认为您具有以下元素: // 带有 sibking div

div // 有一个孩子 a

a // 并且它们都有适当的类

对于此标记,您可以使用以下代码(当然是 jQuery)

var listoflinks = []; //array containing your links
$('a[class="sibling a"]').siblings('div[class="sibling div"]').children('a[class="child a"]').each(function () {
    if ((($(this).attr("href")).substring(0,15))=="start-with-link"){
    var i = $(this).attr("href");
    listoflinks.push(i);
    }
    });

在http://jsfiddle.net/flish/HMXDk/查看详细示例

尽管如此,您可以添加更多的兄弟元素和子元素,以防您忘记提及其他 html 实体

<a class="-cx-PRIVATE-uiImageBlock__image" ------------------ <div class="clearfix pvm"> <a class="-cx-PRIVATE-uiImageBlock__image -cx-PRIVATE-uiImageBlock__largeImage lfloat" aria-hidden="true" tabindex="-1" href="somesite.com/some.name.123">

例如,在上面的代码中 ------------------ 是什么意思?

于 2013-02-26T17:33:45.683 回答