0

如果我没有使用正确的术语,请原谅我。我有一个网页,我正试图从中抓取信息。问题是当我查看页面源时,我想要抓取的数据不存在。我在主要http请求触发其他请求之前遇到过这个问题,所以我正在寻找的信息实际上是我使用谷歌浏览器检查-网络功能找到的其他地方。我手动搜索各种文档和 xhr 文件,以便找到具有正确信息的文件。这有时是漫长而乏味的。我还可以使用谷歌浏览器检查功能来检查包含我想要的信息并显示正确源代码的元素,但我似乎无法弄清楚我可以在哪里或如何使用它来快速找到相应的 HTTP 标头.

简而言之 - 我可以使用谷歌浏览器的检查元素功能,然后要求它向我显示生成该代码的相应网络事件(HTTP 请求)吗?

我将添加我正在处理的案例研究。

 http://www.flashscore.com/tennis/atp-singles/acapulco/results/

显示了在网球锦标赛中进行的不同比赛。我正在尝试抓取匹配的 href,但如果您查看页面的源代码,您会发现它们不存在。

谢谢

4

2 回答 2

1

简而言之 - 我可以使用谷歌浏览器的检查元素功能,然后要求它向我显示生成该代码的相应网络事件(HTTP 请求)吗?

不,这不是浏览器跟踪的内容。

在大多数情况下,HTTP 响应在最终变成页面上的元素之前会经过大量的 Javascript 代码。跟踪哪个 HTTP 响应对给定元素“负责”将涉及大量数据流分析,并且对于浏览器来说是不切实际的。

于 2016-10-16T17:48:59.570 回答
0

One way:

open firefox, install LiveHttpHeaders, then run it, and you will see the expected HEADERS.

There's the same addon for google chrome, but not tested.

于 2016-10-16T17:37:35.990 回答