1

我不确定如何表达我的问题,但我会尽力而为。

如果我加载一个网页,它会在 HTML 中执行一个 JavaScript 文件。如果我查看页面源代码,我可以看到该 JavaScript 的源代码(尽管它的格式不是很好并且难以理解)。

有没有办法在不通过浏览器的情况下从 Python 代码运行 JavaScript?即,如果我想访问该 JavaScript 中的特定函数,是否有一种干净的方法可以从 Python 脚本中调用它并读取结果?

例如...网页显示我想要访问的号码。它不在页面源代码中,因为它是 JavaScript 调用的结果。有没有办法从 Python 调用该 JavaScript?

4

3 回答 3

1

如果你想抓取一个包含 javascript 的页面,你至少有两个选择:

  • 使用selenium加载页面并获取您感兴趣的节点值
  • 使用python-spidermonkey直接从您的 python 脚本中利用 javascript 并获取您感兴趣的值。
于 2013-07-10T19:33:19.947 回答
0

我认为您在谈论混淆 js 代码

你总是可以去混淆它们

有很多可用的工具

这是一个 mozilla 的插件 https://addons.mozilla.org/en-us/firefox/addon/javascript-deobfuscator/

和一个在线工具 http://jsbeautifier.org/

于 2013-07-10T18:39:29.413 回答
0

虽然你的问题不是很清楚。我猜您正在尝试访问 javascript 控制台。

在谷歌浏览器中:

  • 按 F12
  • 转到“控制台”选项卡

在安装了 Firebug 的 Mozilla Firefox 中:

  • 打开萤火虫
  • 转到“控制台”选项卡

您可以从控制台执行 javascript 查询(调用函数、访问变量等)。

我希望这能正确回答你的问题。

于 2013-07-10T18:36:25.947 回答