2

我看过很多关于 cookiejar 的教程,但我的问题是我想转义的网页使用 javascript 创建 cookie,我似乎无法检索 cookie。有人有解决这个问题的方法吗?

4

4 回答 4

3

如果所有页面都具有相同的 JavaScript,那么也许您可以解析 HTML 以找到那段代码,并从中获取 cookie 将设置的值?

这会使您的抓取很容易受到第三方网站更改的影响,但在抓取时最常见的是这种情况。(请记住,第三方网站所有者可能不喜欢您以这种方式获取内容。)

于 2009-07-12T17:55:59.243 回答
1

我也回答了你的另一个问题:看看mechanize。它可能是我所知道的功能最全的抓取模块:如果发送了 cookie,那么我相信你可以使用这个模块来获取它。

于 2009-07-13T07:19:38.727 回答
0

也许您可以在带有 Python 绑定(如python-spidermonkeypyv8 )的 JavaScript 引擎中执行 JavaScript 代码,然后检索 cookie。或者,由于 javascript 代码无论如何都是在客户端执行的,因此您可以将 cookie 生成代码转换为 Python。

于 2009-07-12T16:47:09.600 回答
0

您可以使用真正的浏览器,通过PAMIEwin32com或类似的方式访问该页面,然后 JavaScript 将在其本地环境中运行。

于 2009-07-12T17:52:35.850 回答