4

如果我使用 wget,并从 URL 获取 html 文件。如何从该 HTML 文件生成 HAR 文件。

  1. 任何用于从 html 文件生成 har 文件的开源实现?
  2. 生成 HAR 文件后,我可以使用harlib从 HAR 文件中读取数据。

如果可能,请建议 C、C++ 或 Java 实现。

4

1 回答 1

5

HAR 格式的主要目的是拥有许多工具可以使用和分析的标准 HTTP 跟踪格式。换句话说,它的初衷是并且主要是为了性能分析,而不是“归档”网页本身。

如果您使用 获取页面wget,您将丢失 99% 的所有性能数据。要捕获必要的数据,您确实需要一个浏览器来执行请求、获取所有相关资源、保存所有计时器等。这将使您能够构建瀑布图等。

如果您需要在服务器上捕获此数据,则可以使用 pcap 捕获 TCP 跟踪,然后将其转换为 HAR,尽管您仍然需要一个实际解析 HTML 并请求所有子资源的客户端(pcap 是只是在后台听)。或者,您可以通过代理路由浏览器并让它为您输出一个 HAR 文件。

最后但同样重要的是,您可以通过其调试界面驱动浏览器并以这种方式导出 HAR 文件。驱动 Firefox 的 Java 示例:https ://github.com/Filirom1/browsermob-page-perf

于 2012-05-12T16:08:12.177 回答