0

当我使用检查元素代码查看代码时抓取站点时,当我查看站点的源代码时,代码是不同的。
我想在 PHP 中使用 curl 如何获取使用检查元素可以看到的代码。
页面通过 ajax 调用获取详细信息,但该 ajax 调用
href 中没有 href,我需要获取特定页面的详细信息。

这是卷曲请求

    $login = curl_init();
    curl_setopt($login, CURLOPT_URL,www.example.com);
    curl_setopt($login, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:42.0) Gecko/20100101 Firefox/42.0');
    curl_setopt($login, CURLOPT_RETURNTRANSFER, TRUE);
    curl_setopt($login, CURLOPT_FOLLOWLOCATION, TRUE);
    curl_setopt($login, CURLOPT_SSL_VERIFYPEER, FALSE);
    curl_setopt($login, CURLOPT_TIMEOUT, 40000);
    $html = curl_exec ($login);
4

2 回答 2

0

View Page Source = "服务器端 HTML 代码"

Inspect Element = "客户端 HTML 代码"

它们不会完全相同。检查元素可以根据客户进行更改。

于 2017-03-20T11:47:54.670 回答
0

那么你可以使用Phantom JS。它是一个可编写脚本的无头网络浏览器。它基于 web kit 并且支持许多 web 标准。它可用于截屏、检查页面元素。它可以从 Php 调用,因此您应该能够从 Php 检查页面元素,就像从浏览器开发人员工具箱检查页面元素一样。此链接显示如何使用 Php 中的 Phantom JS:https ://github.com/jonnnnyw/php-phantomjs

于 2017-03-21T05:55:38.757 回答