0

我正在尝试从页面中查找嵌入式流链接。当我检查该页面的源代码时,它返回类似于以下内容:

<script type='text/javascript'> swidth='640', sheight='460';</script>
<script type='text/javascript' src='http://www.sawlive.tv/embed/hqfootyerech1'></script>

也返回如下代码:

http://sawlive.tv/embed/watch/xxxxxxx_

我试图file_get_contents爬到http://www.sawlive.tv/embed/hqfootyerech1但它没有返回任何东西。

该页面仅从http://myiframe12.altervista.org/加载

有没有办法获取页面的完整源代码,包括嵌入页面和脚本?我可以使用 Firefox 检查该页面上加载的元素,但源代码不同。

我听说过 Selenium2。但也不知道它是如何工作的。

4

1 回答 1

0

你应该使用file_get_content. 如果您使用 http 或文件路径调用它,则会有所不同。

如果您想获得源代码,您应该编写:

file_get_contents('path/to/YOUR/FILE.php');

您可能使用不同的 URL 调用了一个文件,如果您使用 http,您只能看到 PHP 脚本的输出,因此请使用路径。

我认为您无法访问不在您域中的文件的源代码,但我不确定。

*编辑:*

万一这不起作用,我发现了这段代码,未经测试,但也应该可以工作:

ob_start();
include "yourfile.php";
$myvar = ob_get_contents();
ob_end_clean();
于 2012-06-30T09:58:13.910 回答