0

我现在真正知道的唯一编程语言是 python。我对javascript很陌生。现在,我正在尝试制作一个简单的程序,通过网站为我收集信息。

在网站上,有一长串指向其他页面的链接。如果您将鼠标悬停在一个附近,另一个链接将出现在显示“Find Dupes”(重复项的缩写)的一侧。我在页面源代码中找到了这个:

<a href="javascript:void(0)" onclick="getDuplictes(1020347166, true)">Find Dupes</a>

因此,当您单击 javascript 链接时,会弹出一个 iframe:

</div>  
</center>

<div id="ActionDiv" style="position: absolute;z-index: 400; width:400; display:none">

<iframe id="ActionFrame" src="" style="width:400;height:400" scrolling="no"         frameborder="0" ></iframe>
</div>

<div id="DuplicatesDiv" style="position: absolute;z-index: 200; width:600; display:none">
<iframe id="DuplicatesFrame" src="" style="width:600;height:400" scrolling="auto" frameborder="0" ></iframe>
</div>

<script>
function getDuplictes(placeId, findInLoca, feedId){

if(isUndefined(feedId)){
    feedId = 0;
}

if(isUndefined(findInLoca)){
    duplicatesUrl = "/places/duplicates.jsp?inPID=" + placeId + "&inFeedID=" + feedId;
}else{
    duplicatesUrl = "/places/duplicates.jsp?inPID=" + placeId + "&inFindInLoca=" + findInLoca +  "&inFeedID=" + feedId;
}

showFrameDiv( duplicatesUrl, "DuplicatesFrame", "DuplicatesDiv", "LocaBlur")
}
</script>

并且信息每次都会有所不同,具体取决于您单击的链接。

我想要做的是以某种方式获取 iframe 中显示的信息,这些信息以一种有组织的、可读的形式显示,而无需实际打开和使用 Web 浏览器。我希望能够查看一个 iframe 的内容,决定是否需要它,然后单击下一步查看下一个。每页大约有 100 个“Find Dupes” iframe,可能有 50 页。无论如何,我的主要问题是如何使用python或javascript或其他东西获取特定iframe的内容(我对javascript一无所知......)

谢谢。

4

1 回答 1

0

使用 python,您可以使用PyQuery获取onclick每个锚标记的属性,使用正则表达式解析它以获取placeId,自己构建/places/duplicates.jsp?inPID=URL,使用请求在该 URL 处加载内容,然后再次对内容进行 PyQuery 以获取数据你需要。

于 2012-08-09T14:09:33.120 回答