-1

我有一个包含一些 java 脚本标签的 HTML 文件。当我在某些浏览器(例如 IE)中运行此文件时,某些内容会从其源缓存并显示在浏览器上(例如某些城市的天气)。如何运行此html文件并获取之前在 Web 浏览器上显示的网页内容?我不想在我的应用程序上显示内容;我想解析返回的数据并提取一些特殊的内容(例如提取每个城市的天气)。有人可以指导我吗?

4

2 回答 2

1

您正在尝试做的事情称为 html 抓取。

您最好的选择是以库的形式获得帮助,因为这是一项常见且复杂的任务。

请参阅此问题:HTML 抓取的选项?

于 2012-04-04T07:28:14.673 回答
0

硒是一个不错的选择。它支持 HtmlUnit、Firefox、Chrome 以及其他浏览器。

链接:http ://seleniumhq.org/

于 2012-04-04T07:30:46.527 回答