在 DOM 解析器中将字符串加载为 HTML,遍历文本节点,并检查 URL。确保文本节点的父节点不是<a>
标签,这样你就知道你得到的文本不在链接中。现在,找到所有的 URL,将它们转换为<a>
标签,然后在 DOM 中替换它们:
$doc = new DOMDocument();
$doc->loadHTML( $str);
$xpath = new DOMXpath($doc);
foreach( $xpath->query('//text()') as $text) {
if( !($text->parentNode->tagName == "a")) {
$frag = $doc->createDocumentFragment();
$frag->appendXML( preg_replace('#(http://stackoverflow.com/)#', '<a href="$1">$1</a>', $text->data));
$text->parentNode->replaceChild( $frag, $text);
}
}
请注意,这依赖于正则表达式来识别 URL,这是一项艰巨的任务。我建议找到一个适合您的需求,因为它目前正在使用:
#(http://stackoverflow.com/)#
但是,鉴于此输入:
http://stackoverflow.com/ is a wonderful URL.
<a href="http://stackoverflow.com/">Has already been linked.</a>
<a href="http://stackoverflow.com/">http://stackoverflow.com/</a>
它产生这个输出:
<p><a href="http://stackoverflow.com/">http://stackoverflow.com/</a> is a wonderful URL.
<a href="http://stackoverflow.com/">Has already been linked.</a>
<a href="http://stackoverflow.com/">http://stackoverflow.com/</a></p>