我正在使用 PHP Simple HTML DOM Parser 来获取<h1>
不同网页上第一个标签的内容。该脚本大部分时间都运行良好,但在某些网页上,我的脚本只是有点“挂断”。脚本停止,没有完成我下面列出的代码。我查看了那些不起作用的页面的来源,但它们的<h1>
内容并没有什么特别的不同。有没有办法让它适用于所有可能的 URL,如果没有,我该如何修复我的脚本,使其不会因为 URL 不起作用而挂起?
include_once( 'simple_html_dom.php');
$html = file_get_html($webpage);
$element = $html->find('h1', 0);
$element = strip_tags($element);