我正在使用正则表达式来获取 html 页面的所有脚本标记的内容。我使用的正则表达式和代码如下:
$content = file_get_contents($url, false, stream_context_create(
array("http" => array("user_agent" => "any"))
));
$pattern = "/<script[^>]*?>([\s\S]*?)<\/script>/";
preg_match_all($pattern, $content, $inside_script_array);
echo "<pre>";
print_r($inside_script_array);
echo "</pre>";
当我拿 1.>
$url = 'http://www.bestylish.com/' ;
它返回我所有的脚本标签。但是当我拿 2.>
$url = 'http://www.bestylish.com/sale' ;
它没有回复我很多相同的标签,并且出现在上面的 url 1 中。应该是什么原因?