我正在做一种代理。我的 php 脚本下载一个网页,然后显示下载的内容。输出看起来不像原始网页,因为需要更正一些 url(css、链接、图像等)。所以我正在寻找一个可以获取所有 html 元素src
和href
属性的库,以便我可以更改值。例如:
<link href="/images/favicon.ico">
需要改为
<link href="http://example.com/images/favicon.ico">
做这个的最好方式是什么?
我正在做一种代理。我的 php 脚本下载一个网页,然后显示下载的内容。输出看起来不像原始网页,因为需要更正一些 url(css、链接、图像等)。所以我正在寻找一个可以获取所有 html 元素src
和href
属性的库,以便我可以更改值。例如:
<link href="/images/favicon.ico">
需要改为
<link href="http://example.com/images/favicon.ico">
做这个的最好方式是什么?
<?php
require_once('controller/simple_html_dom.php');
$str = '<link rel="stylesheet" type="text/css" href="/css/normalize.css?StillNoSpring"/>
<script type="text/javascript" src="/js/heyoffline.js?StillNoSpring"></script>';
$html = str_get_html($str);
foreach($html->find('link[rel=stylesheet]') as $styleSheets) {
echo $styleSheets->getAttribute('href')."<br/>";
}
foreach($html->find('script[type=text/javascript]') as $scripts) {
echo $scripts->getAttribute('src')."<br/>";
}
?>
您将获得以下链接
/css/normalize.css?StillNoSpring
/js/heyoffline.js?StillNoSpring