2

我的问题类似于这个问题:

如何模仿 StackOverflow 自动链接行为

但是,此解决方案不适用于可能已经包含链接的混合内容 - 已经在 A 标签内的任何 URL<a href="http://stackoverflow.com">My Link</a>都被破坏<a href="<a href="http://stackoverflow.com">stackoverflow.com</a>">My Link</a>

这是所需的行为:

https://stackoverflow.com/ is a wonderful URL.

<a href="https://stackoverflow.com/">Has already been linked.</a>

<a href="https://stackoverflow.com/">https://stackoverflow.com/</a> is a wonderful URL.

<a href="https://stackoverflow.com/">Has already been linked.</a>
4

1 回答 1

2

在 DOM 解析器中将字符串加载为 HTML,遍历文本节点,并检查 URL。确保文本节点的父节点不是<a>标签,这样你就知道你得到的文本不在链接中。现在,找到所有的 URL,将它们转换为<a>标签,然后在 DOM 中替换它们:

$doc = new DOMDocument();
$doc->loadHTML( $str);

$xpath = new DOMXpath($doc);
foreach( $xpath->query('//text()') as $text) {
    if( !($text->parentNode->tagName == "a")) {
        $frag = $doc->createDocumentFragment();
        $frag->appendXML( preg_replace('#(http://stackoverflow.com/)#', '<a href="$1">$1</a>', $text->data));
        $text->parentNode->replaceChild( $frag, $text);
    }
}

请注意,这依赖于正则表达式来识别 URL,这是一项艰巨的任务。我建议找到一个适合您的需求,因为它目前正在使用:

#(http://stackoverflow.com/)#

但是,鉴于此输入:

http://stackoverflow.com/ is a wonderful URL.

<a href="http://stackoverflow.com/">Has already been linked.</a>

<a href="http://stackoverflow.com/">http://stackoverflow.com/</a>

产生这个输出

<p><a href="http://stackoverflow.com/">http://stackoverflow.com/</a> is a wonderful URL. 

<a href="http://stackoverflow.com/">Has already been linked.</a> 

<a href="http://stackoverflow.com/">http://stackoverflow.com/</a></p>
于 2013-05-02T21:04:22.243 回答