如果信息是由 Javascript 生成的,我正在尝试用 Python 抓取一些网页。
我设法通过使用带有 PyQt4 的无头浏览器检索页面加载时生成的信息(例如:http: //blog.motane.lu/2009/07/07/downloading-a-pages-content-with-python-and -webkit/ )
但是现在,我正在尝试检索一些通过让用户单击 Javascript 链接而生成的信息。
我怎样才能做到这一点?
谢谢
如果信息是由 Javascript 生成的,我正在尝试用 Python 抓取一些网页。
我设法通过使用带有 PyQt4 的无头浏览器检索页面加载时生成的信息(例如:http: //blog.motane.lu/2009/07/07/downloading-a-pages-content-with-python-and -webkit/ )
但是现在,我正在尝试检索一些通过让用户单击 Javascript 链接而生成的信息。
我怎样才能做到这一点?
谢谢
我猜你需要Form Extractor Example。诀窍是您可以将任何 python 对象公开给 javascript 并调用其方法。这个例子的 Pytonic 版本可以在 PyQt 发行版中找到。