我有一个 HTML 代码,我想从中删除一些特定的标签。我试图不解析它和检索标签。所以,我得到了一个字符串中的整个 HTML 代码。我想删除以下标签:
<cite>www.youtube.com/watch?v=
为此,我正在使用:
array=htmlCode.split("<cite>www.youtube.com/watch?v=");
此标签出现多次。但是当我拆分时,我的数组中没有子字符串,只有一个完整的代码字符串。为什么会这样?
您需要转义.
并?
使用正则表达式,因为它们具有特殊含义。通常,您会使用单个反斜杠\
. 但是,我们在一个字符串的中间,\
不幸的是,引号内也有特殊的含义。所以,我们必须再次转义它,这就是为什么我们需要两个反斜杠,\\
.
例子:
String htmlCode = "START<cite>www.youtube.com/watch?v=END";
String result = htmlCode.replaceAll("<cite>www\\.youtube\\.com/watch\\?v=", "");
System.out.println(result);
输出:
STARTEND
奖金:
RegexPal是用于测试正则表达式的便捷工具。