0

关于这个问题已经有几篇安静的帖子,但似乎没有人真正回答我的问题。

我使用TIdHttp来加载这个网站的源代码:http: //www.nationalgeographic.com/

我尝试提取一些数据,但意识到数据是由脚本生成的。源代码中有一个脚本和一些外部 js 文件的链接。

我怎么可能运行页面上的部分或全部脚本并生成源代码?

我在辅助线程中使用这部分,并希望避免使用 WebBrowser 组件。

我可以从 Idhttp 生成的源代码中提取脚本或链接,但是运行一个 js 文件,idhttp.get(*.js)但我认为这可能太简单而无法工作。

4

1 回答 1

1

最后,答案非常基本:

document := webBrowser.Document as IHTMLDocument2; result := document.body.innerHTML;

它检索源代码并包含脚本在运行时动态生成的内容。

于 2015-09-03T14:43:57.657 回答