1

我有一个 HTML 代码,我想从中删除一些特定的标签。我试图不解析它和检索标签。所以,我得到了一个字符串中的整个 HTML 代码。我想删除以下标签:

<cite>www.youtube.com/watch?v=

为此,我正在使用:

array=htmlCode.split("<cite>www.youtube.com/watch?v=");

此标签出现多次。但是当我拆分时,我的数组中没有子字符串,只有一个完整的代码字符串。为什么会这样?

4

1 回答 1

1
  1. 您需要转义.?使用正则表达式,因为它们具有特殊含义。通常,您会使用单个反斜杠\. 但是,我们在一个字符串的中间,\不幸的是,引号内也有特殊的含义。所以,我们必须再次转义它,这就是为什么我们需要两个反斜杠,\\.

  2. replaceAll(String regex, String replacement)是您正在寻找的方法。

例子:

String htmlCode = "START<cite>www.youtube.com/watch?v=END";
String result = htmlCode.replaceAll("<cite>www\\.youtube\\.com/watch\\?v=", "");
System.out.println(result);

输出

STARTEND

奖金:

RegexPal是用于测试正则表达式的便捷工具。

于 2013-10-03T11:44:53.467 回答