php - 为什么 PHP Simple HTML DOM Parser 无法从某些 URL 捕获标签的内容？

Question

我正在使用 PHP Simple HTML DOM Parser 来获取<h1>不同网页上第一个标签的内容。该脚本大部分时间都运行良好，但在某些网页上，我的脚本只是有点“挂断”。脚本停止，没有完成我下面列出的代码。我查看了那些不起作用的页面的来源，但它们的<h1>内容并没有什么特别的不同。有没有办法让它适用于所有可能的 URL，如果没有，我该如何修复我的脚本，使其不会因为 URL 不起作用而挂起？

include_once( 'simple_html_dom.php');
$html = file_get_html($webpage);
$element = $html->find('h1', 0);
$element = strip_tags($element);

score 0 · Accepted Answer

我从来没有得到回应，但似乎答案是使用 cURL 获取 url 的内容，然后使用 PHP Simple HTML DOM Parser 获取标签信息。

php - 为什么 PHP Simple HTML DOM Parser 无法从某些 URL 捕获标签的内容？

1 回答 1

Related

Reference