0

我正在使用 Notepad++,我必须在其中找到并删除立即重复的 HTML 标记,如下所示

实际的

<a href="www.google.com"><a href="www.google.com">www.google.com</a></a>

必需的

<a href="www.google.com">www.google.com</a>

我有一个正则表达式来查找新行中的重复项,但我的搜索将在一行中。

请帮帮我

4

4 回答 4

2

寻找:

(<(\w+)(\s[^>]*)?>)\1(.*)(<\/\2>)\5

替换

\1\4\5

在 Sublime 中测试。

于 2013-05-06T06:06:37.957 回答
1

对于这种“双链接”,您可以使用:

find: <(a [^>]+)>(<\1>.*?</a>)</a>
replace: \2

对于所有标签,请使用:

find: <((\w+)[^>]*)>(<\1>.*?</\2>)</\2>
replace: \3

(这两个带有最新版本的记事本++)

于 2013-05-06T06:10:07.190 回答
1

搜索模式:

.*">(<.*>)<\/a>

代替:

\1
于 2013-05-06T07:20:34.687 回答
0

试试这个模式

(<(\w+)(\s[^>]*)?>)(\s|\n|\t)*\1(.*)(<\/\2>)(\s|\n|\t)*\6

演示:http ://rubular.com/r/RT7ObfV0i8

替换 \1 和 \6

于 2013-05-06T06:01:27.600 回答