0

我正在使用 PHP Simple HTML DOM Parser 来获取<h1>不同网页上第一个标签的内容。该脚本大部分时间都运行良好,但在某些网页上,我的脚本只是有点“挂断”。脚本停止,没有完成我下面列出的代码。我查看了那些不起作用的页面的来源,但它们的<h1>内容并没有什么特别的不同。有没有办法让它适用于所有可能的 URL,如果没有,我该如何修复我的脚本,使其不会因为 URL 不起作用而挂起?

include_once( 'simple_html_dom.php');
$html = file_get_html($webpage);
$element = $html->find('h1', 0);
$element = strip_tags($element);
4

1 回答 1

0

我从来没有得到回应,但似乎答案是使用 cURL 获取 url 的内容,然后使用 PHP Simple HTML DOM Parser 获取标签信息。

于 2012-08-03T00:45:00.343 回答