0

我正在使用 php 简单的 html dom 库创建一个网络爬虫。我正在做一个网络抓取项目,在一个 php 页面上我加载一个 html 页面进行抓取,并在其中调用另一个 php 页面上的函数,该页面也加载一个或多个 html 页面。问题是我无法加载第二个 html 页面。以下是我在两个页面上使用的用于加载 html 页面进行抓取的功能。第一页

include ('simple_html_dom.php');
$html = new simple_html_dom ();
$html->load_file ( $link );

第一页

$html = new simple_html_dom ();
$html->load_file ( $link );

当代码调用第二个 php 页面时,出现以下错误

Undefined variable: html
4

1 回答 1

1

嗯......我希望我理解你的问题......让我们看看这是否回答了你的问题。

确保在每一页上调用下一行...

include ('simple_html_dom.php'); 

然后我打电话

$html = new simple_html_dom ();
$html->load_file ( $link );

现在,如果我需要很好地调用两个不同的 XML 文件,我会这样做

$html = new simple_html_dom ();
$html->load_file ( $link );
$detail = new simple_html_dom ();
$detail->load_file ( $link2 );

如果您愿意,您实际上可以使用下一个方法加载相同的 XML...

$html = new simple_html_dom ();
$html->load_file ( $link );
$html2 = new simple_html_dom ();
$html2->load_file ( $link );
于 2011-10-24T19:35:35.343 回答