4

我正在尝试查找网页上的所有 href 链接并将链接替换为我自己的代理链接。

例如

<a href="http://www.google.com">Google</a>

需要是

<a href="http://www.example.com/?loadpage=http://www.google.com">Google</a>
4

3 回答 3

9

使用 PHPDomDocument解析页面

$doc = new DOMDocument();

// load the string into the DOM (this is your page's HTML), see below for more info
$doc->loadHTML('<a href="http://www.google.com">Google</a>');

//Loop through each <a> tag in the dom and change the href property
foreach($doc->getElementsByTagName('a') as $anchor) {
    $link = $anchor->getAttribute('href');
    $link = 'http://www.example.com/?loadpage='.urlencode($link);
    $anchor->setAttribute('href', $link);
}
echo $doc->saveHTML();

在这里查看:http: //codepad.org/9enqx3Rv

如果您没有将 HTML 作为字符串,您可以使用 cUrl ( docs ) 来获取 HTML,或者您可以loadHTMLFile使用DomDocument

文档

于 2012-06-27T22:21:52.087 回答
0

如果您想用 jQuery 替换链接,这只是另一种选择,您还可以执行以下操作:

$(document).find('a').each(function(key, element){
   curValue = element.attr('href');
   element.attr('href', 'http://www.example.com?loadpage='+curValue);

});

然而,更安全的方法是在 php offcourse 中进行。

于 2012-11-03T16:37:31.187 回答
-1

我能想到的最简单的方法是:

$loader = "http://www.example.com?loadpage=";
$page_contents = str_ireplace(array('href="', "href='"), array('href="'.$loader, "href='".$loader), $page_contents);

但这可能对包含 ? 或者 &。或者如果文档的文本(不是代码)包含 href="

于 2012-06-27T22:23:13.097 回答