2

我先在 SO 中搜索,发现了这个问题。如何单击在 href 中包含 javascript:__doPostBack 的链接?但它只在 python 中给出了答案。

我需要的是,当浏览一个网站时,一些页面(2、3、4等)的链接如下:

javascript:__doPostBack('AspNetPager1','2')
javascript:__doPostBack('AspNetPager1','3')
javascript:__doPostBack('AspNetPager1','4')

如果我点击它,它会显示下一页,但真正的 url 不会显示在浏览器中。

所以我的问题是,如何将 javascript 链接转换为可追踪的真实 url 并提供给wget/curl/lynx?

我的目的是使用工具(wget/curl/lynx)通过脚本来一一下载这些页面。但是由于这些javascript:__doPostBack,我找不到一个好的方法来做到这一点。

4

1 回答 1

2

你不能真正通过分析来做到这一点。 __doPostBack可以任意复杂。

您应该做的是安装 Firebug(假设您使用的是 Firefox),激活 Network 选项卡,按“Persist”,然后单击该按钮。网络选项卡将向您显示实际的网络流量,您可以从中推断出真实的 URL。事实上,您只需右键单击您感兴趣的特定网络请求并选择“复制为 cURL”,它就会将 curl 指令(包括 cookie 和标头之类的内容)放入您的粘贴缓冲区。

Chrome 内置了一个类似的功能。

于 2014-04-22T06:34:27.257 回答