4

我正在尝试构建一个网络爬虫。
我需要两件事:

  • 将 HTML 转换为 DOM 对象。
  • 按需执行现有的 JavaScript。
我期望的结果是一个 DOM 对象,其中执行加载的 JavaScript 已经执行。
此外,我需要一个选项来按需执行额外的 JavaScript(在诸如:等事件上onMouseOveronMouseClick首先,我找不到好的文档来源。
我搜索了Webkit 主页,但找不到该软件包用户的太多信息,也没有有用的代码示例。另外,在一些论坛中,我看到了不要将 Webkit 接口用于爬虫,而是直接使用 DOM 和 Javascript 内部包的说明。

我正在搜索文档代码示例
此外,关于正确使用的任何建议。

工作环境:
  • 操作系统:Windows
  • 朗:C++

4

1 回答 1

1

查看与 WebKit 主干一起打包的一些测试工具。大多数端口(据我所知)包括 DumpRenderTree 实例化 WebKitView ,然后在处理指定文件后吐出渲染树。从理论上讲,它是可能的 WebKit 最简单的示例之一。

于 2008-12-22T19:01:09.487 回答