我想做一件简单的事情:从字符串(即 HTML 文件)中提取代码的某些特定部分。
例如:
//Get a string from a website:
$homepage = file_get_contents('http://mywebsite.org');
//Then, search a particulare substring between two strings:
echo magic_substr($homepage, "<script language", "</script>");
//where magic_substr is this function (find in this awesome website):
function magic_substr($haystack, $start, $end) {
$index_start = strpos($haystack, $start);
$index_start = ($index_start === false) ? 0 : $index_start + strlen($start);
$index_end = strpos($haystack, $end, $index_start);
$length = ($index_end === false) ? strlen($end) : $index_end - $index_start;
return substr($haystack, $index_start, $length);
}
在这种情况下,我想要获得的输出是页面上的所有脚本。但是就我而言,我只能获得第一个脚本。我认为这是正确的,因为没有任何递归。但我不知道最好的方法是什么!有什么建议么?