我想用脚本获取页面的标题。到目前为止,我能想出的唯一解决方案是它需要先加载整个页面,然后才能开始grep
加载<title>
.
由于标题始终是 的一部分<head>
,因此在获取标题后立即停止加载页面是有意义的。
我怎样才能做到这一点?我愿意接受多种语言的解决方案。
我想用脚本获取页面的标题。到目前为止,我能想出的唯一解决方案是它需要先加载整个页面,然后才能开始grep
加载<title>
.
由于标题始终是 的一部分<head>
,因此在获取标题后立即停止加载页面是有意义的。
我怎样才能做到这一点?我愿意接受多种语言的解决方案。
在 PHP 中,您可以使用file_get_contents
和限制字节数:
$file = file_get_contents('URL', FALSE, NULL, 0, x); //Only load first x bytes
preg_match("/<title>(.*)<\/title>/i", $file, $matches);
$title = $matches[0];
给定支持的 HTTP 服务器,您可以使用content-range限制下拉的数据量,并希望您下拉的数据量足以到达标题元素。
使用 jQuery .load()/.ajax() 方法