13

我有一个 html 字符串,其中恰好包含一个 a 元素。例子:

   <a href="http://www.test.com" rel="nofollow external">test</a>

在 php 中,我必须测试rel是否包含外部,如果是,则修改href并保存字符串。

我一直在寻找 DOM 节点和对象。但是它们似乎对于只有一个 A 元素来说太多了,因为我必须迭代以获得 html 节点,而且我不确定如何测试rel是否存在并包含external

$html = new DOMDocument();
$html->loadHtml($txt);
$a = $html->getElementsByTagName('a');
$attr = $a->item(0)->attributes();
...

在这一点上,我将获得似乎是开销的 NodeMapList。有没有更简单的方法或者我应该用 DOM 来做?

4

4 回答 4

12

有没有更简单的方法或者我应该用 DOM 来做?

用 DOM 来做。

这是一个例子:

<?php
$html = '<a href="http://example.com" rel="nofollow external">test</a>';
$dom = new DOMDocument;
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$nodes = $xpath->query("//a[contains(concat(' ', normalize-space(@rel), ' '), ' external ')]");
foreach($nodes as $node) {
    $node->setAttribute('href', 'http://example.org');
}
echo $dom->saveHTML();
于 2013-04-22T05:12:11.027 回答
2

我一直在用 DOM 进行修改。这就是我得到的:

$html = new DOMDocument();
$html->loadHtml('<?xml encoding="utf-8" ?>' . $txt);
$nodes = $html->getElementsByTagName('a');
foreach ($nodes as $node) {
    foreach ($node->attributes as $att) {
        if ($att->name == 'rel') {
            if (strpos($att->value, 'external')) {
                $node->setAttribute('href','modified_url_goes_here');
            }
        }
    }
}
$txt = $html->saveHTML();

我不想只为这个字符串加载任何其他库。

于 2013-04-21T02:24:04.390 回答
1

最好的方法是使用 HTML 解析器/DOM,但这里有一个正则表达式解决方案:

$html = '<a href="http://www.test.com" rel="nofollow external">test</a><br>
<p> Some text</p>
<a href="http://test.com">test2</a><br>
<a rel="external">test3</a> <-- This won\'t work since there is no href in it.
';

$new = preg_replace_callback('/<a.+?rel\s*=\s*"([^"]*)"[^>]*>/i', function($m){
    if(strpos($m[1], 'external') !== false){
        $m[0] = preg_replace('/href\s*=\s*(("[^"]*")|(\'[^\']*\'))/i', 'href="http://example.com"', $m[0]);
    }
    return $m[0];
}, $html);

echo $new;

在线演示

于 2013-04-21T02:25:02.173 回答
0

You could use a regular expression like if it matches /\s+rel\s*=\s*".*external.*"/ then do a regExp replace like /(<a.*href\s*=\s*")([^"]\)("[^>]*>)/\1[your new href here]\3/

Though using a library that can do this kind of stuff for you is much easier (like jquery for javascript)

于 2013-04-21T01:49:23.507 回答