我simple_html_dom
用来获取网站的图像。但有时,图像的链接没有以完整的域 URI 为前缀,例如http://example.com
. 它们看起来像
- 图片/_home-ss-21.jpg
- /_home-ss-22b.jpg
- ./_1249a7s.png 或
- ../../../a19489s_20110412.jpeg。
如何将这些 URI 转换为绝对 URI,包括协议和域信息。
<?php
header('Content-type:text/html; charset=utf-8');
require_once 'simple_html_dom.php';
$v = 'http://www.typepad.com/';
$html = file_get_html($v);
foreach($html->find('img') as $element) {
echo $element->src.'<hr />';
}
?>