3

我在网站上发表评论部分。起初我需要做一个正则表达式来查找任何 url 并将其替换为

<a href="url"></a>  

所以我找到了一个超级正则表达式来查找评论中的所有 url,我做了一个函数来返回所有带有 html 标记的 url:

function addURLTags($string) {
    $pattern = "/(?i)\b((?:https?:\/\/|www\d{0,3}[.]|[a-z0-9.\-]+[.][a-z]{2,4}\/)(?:[^\s()<>]+|\(([^\s()<>]+|(\([^\s()<>]+\)))*\))+(?:\(([^\s()<>]+|(\([^\s()<>]+\)))*\)|[^\s`!()\[\]{};:'\".,<>?«»“”‘’]))/";
    return preg_replace($pattern, '<a href="$1">$1</a>', $string);
}

一切都很顺利。但是一周前我的老板告诉我,现在我必须将 bbcode 添加到评论部分。我就像“没问题”......但后来他告诉我我的功能 addURLTags 必须留下。

所以任何这样的字符串:

http://www.google.com
[url]http://www.google.com[/url]
[url="http://www.google.com"]http://www.google.com[/url]

必须替换为相同的字符串:

<a href="http://www.google.com">http://www.google.com</a>

所以我得到了一个小 php 库,它将所有 bbcode 出现替换为 html 代码。

我想:“好吧,首先我应该得到所有在开始时没有 [url] 标签的 url 出现!然后我替换所有 bbcode 标签”

我试图在超级正则表达式的开头添加一个否定断言,如下所示:

/(?i)\b((?![url])(?:https?://|www\d{0,3}[.]|[a-z0-9.-]+[.][ az]{2,4}/)(?:[^\s()<>]+|(([^\s()<>]+|(([^\s()<>]+)) ) ))+(?:(([^\s()<>]+|(([^\s()<>]+))) )|[^\s`!()[]{}; :'\".,<>?«»“”'']))/

但没用!

我是一个使用正则表达式的新手,我尝试过的所有在线测试人员都不能很好地使用这么长的正则表达式。我不知道还有什么尝试。

你有什么建议吗?你知道有和没有 [url] bbcode 标签的“url 替换”的任何 PHP 库吗?

先感谢您。

4

2 回答 2

1

你在这里解决了两个问题。因此,分别解决它们,不要将所有内容都放入一个正则表达式中,这或多或少会使事情变得更复杂而不是更少。

分而治之:

首先使用您的 bbcode 库找到这些 url 所在的部分,以便您可以创建文本流:

"normal text", "bbcode", "normal text", "bbcode"

然后您应用 bbcode 库仅在“bbcode”段上创建 URL,并且您的 URL clickable-maker 将仅应用于“普通文本”段。

处理完所有段后,将所有段连接回一个字符串。

瞧,问题解决了。

于 2012-04-14T14:28:52.663 回答
0

最好先解析[url]BBCode,然后将任何裸 URL 制作成链接。这很容易通过使用否定的lookbehind来实现,以确保URL之前没有双引号。这是有效的,因为您应该已经将原始字符串中的引号转换为&quot;,因此必须将 URL 之前的任何实际引号作为链接创建者的一部分放在那里。

于 2012-04-14T13:49:49.543 回答