1

我需要用实际的可点击链接替换 ​​HTML 文本字符串中的所有文本链接。适用于以下正则表达式:

/\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/gi

然后我注意到它还替换了图像和已经格式化的链接。我需要排除以 src" 和 > 开头的链接的数字 ...

/(^(?!src="|>)\b(https?|ftp|file):\/\/[-A-Z0-9+&@#\/%?=~_|!:,.;]*[-A-Z0-9+&@#\/%=~_|])/gi

但这不再匹配任何链接。我尝试了几个类似的语句,没有 ^,更改了一些括号等,但似乎没有任何效果。我尝试.{0}在我添加的部分和 \b 之间插入,以确保他只会查看 url 前面的内容而不考虑更远的内容。

4

3 回答 3

3

编辑:讨论时间越来越长,所以我决定更新答案。

相信您的原始正则表达式有效,我将在此答案的其余部分引用简化版本:

/\b(https?|ftp|file)/gi

现在,你尝试了这个:

/^(?!src="|>)\b(https?|ftp|file)/gi
 ^

这里的主要错误由插入符号标记:插入符号。这会迫使您的正则表达式从行首匹配,这就是它不匹配的原因。让我们删除它并继续:

/(?!src="|>)\b(https?|ftp|file)/gi

这一次,主要错误在于您对前瞻断言的概念。正如我在评论中解释的那样,这个断言是多余的,因为你是在说,“匹配httpor httpsor ftpor file,只要这些都不是src="or >。” 这几乎是多余的,以至于这句话对我们来说甚至没有意义!相反,您想要的是一个后向断言

/(?<!src="|>)\b(https?|ftp|file)/gi
   ^

为什么?因为您希望找到src="或在您可能希望匹配的字符串> 后面。问题?JavaScript 不支持后向断言。所以,我提出了一个替代方案。诚然,它是有缺陷的(尽管不是 HTML 中断的原因,正如您所提到的)。在这里,固定:

/(.[^>"]|[^=]")\b(https?|ftp|file)/gi
  ^^^^^^^^^^^^

这确实是一个非直观的正则表达式,需要解释。它将我们的案例一分为二。假设我们有一个两个字符集。如果集合>以or结尾",那么我们不怀疑它;我们可以走了;匹配任何可能跟随的 URL。但是,如果它确实>以or结尾",那么唯一“可原谅”的情况是第一个字符不是=. 所以你看,这里有点逻辑诡计。

现在,至于为什么这可能会破坏您的 HTML。请务必使用 JavaScript replace,并将第一个捕获的组替换回页面!如果你只是用虚无替换每个匹配项,你最终会“吃掉”两个字符集,我们只是想调查,而不是破坏。

html.replace(/(.[^>"]|[^=]")\b(https?|ftp|file)/gi,
             function(match, $1, offset, original) {
                 return $1;
             });
于 2012-07-31T16:53:29.230 回答
0

我必须回家,还没有测试,但我会觉得更轻松地处理隔离你不想先出来的 HTML 的更简单的任务。

  1. 进行匹配以获取您不想处理的内容的数组。
  2. 用分裂把它全部撕掉。
  3. 迭代拆分数组并替换 URL,然后将匹配的项目拼接回
  4. 加入并返回

唯一的假设是您不会以文本中的锚点或 img 标记结尾

function zipperParse(htmlText,matcher){
    var zipBackInArray = htmlText.match(matcher),
    workingArray = htmlText.split(matcher),
    i = workingArray.length;

    while(i--){
        buildAnchorTagIfURLPresent(workingArray[i]); //You got this one covered
        workingArray.splice(i,0,zipBackInArray.pop());
        //working backwards makes splice much easier to use here
    }
    return workingArray.join('');    
}

var toExclude = /<a[^>]*>[^>]*>|<img[^>]*>/g;
// is supposed to match all img and anchor pairs but not handling tags inside anchors yet

zipperParse(yourHtmlText,toExclude);
于 2012-07-31T23:38:17.597 回答
0

这段代码对我有用...只需将 Google Api KEY 更改为排除 ..=> XXXXXXXXXXXXXXXXXXXXXX 我只是把它放在我的wordpress 的functions.php 主题中。首先是看,您的谷歌地图代码如何出现在您的网站上,然后将其与被替换的内容相匹配。

function remove_script_version( $src ) { 
$parts1 = explode( '?', $src );
$parts2 = str_replace('//maps.googleapis.com/maps/api/js', '//maps.googleapis.com/maps/api/js?language=es&#038;v=3.31&#038;libraries=places&#038;key=XXXXXXXXXXXXXXXXXXXXXX&#038;ver=3.31', $parts1);
return $parts2[0]; }
add_filter( 'script_loader_src', 'remove_script_version', 15, 1 );
add_filter( 'style_loader_src', 'remove_script_version', 15, 1 );
于 2020-05-07T00:09:35.583 回答