0

我希望检索网站的来源,该来源是在单击链接时动态生成的。链接本身如下:

<a onclick="function(); return false" href="#">Link</a>

这使我无法直接查询允许我获取动态生成的网站 (urllib/2) 的 URL。

如何检索网站的来源,它是通过 python 使用上述函数(在 HTML 中)生成的?有没有绕过的方法return false" href="#"?或者onclick完全,并获得实际的 URL?

如果有另一种方法可以从上面的抽象链接生成网站,以便可以从 python 中的 urllib 中获取,请参考我。


编辑:

我概括了上面看到的代码 - 但是我被告知必须对特定的 javascript 进行逆向工程才能使用它。

链接到 .js - http://a.quizlet.com/j/english/create_setku80j8.js

链接到带有链接的网站:

<a onclick="importText(); return false" href="#">Bulk-import data</a>

网站实际网址:http: //quizlet.com/create_set/

以上相关.js的美化JS:http: //pastie.org/737042

4

2 回答 2

2

您可能必须对 JavaScript 进行逆向工程才能弄清楚发生了什么。

你能提供有问题的网站和链接吗?

于 2009-12-10T09:49:54.523 回答
1

我没有立即在该脚本中看到任何内容生成或链接跟踪代码;所做importText的只是切换是否显示一些 div。

如果您想研究 webapp 为执行特定操作而进行的调用,以便从机器人中重现它们,您最好查看浏览器在执行该操作时发出的 HTTP 请求(表单提交和 AJAX 调用)行动。您可以使用 Firebug 的“网络”面板来研究 Firefox 或 Fiddler 的 IE。

于 2009-12-10T13:24:41.493 回答