java - 使用带有特殊字符的字符串进行拆分

Question

我有一个 HTML 代码，我想从中删除一些特定的标签。我试图不解析它和检索标签。所以，我得到了一个字符串中的整个 HTML 代码。我想删除以下标签：

<cite>www.youtube.com/watch?v=

为此，我正在使用：

array=htmlCode.split("<cite>www.youtube.com/watch?v=");

此标签出现多次。但是当我拆分时，我的数组中没有子字符串，只有一个完整的代码字符串。为什么会这样？

score 1 · Accepted Answer

您需要转义.并?使用正则表达式，因为它们具有特殊含义。通常，您会使用单个反斜杠\. 但是，我们在一个字符串的中间，\不幸的是，引号内也有特殊的含义。所以，我们必须再次转义它，这就是为什么我们需要两个反斜杠，\\.
replaceAll(String regex, String replacement)是您正在寻找的方法。

例子：

String htmlCode = "START<cite>www.youtube.com/watch?v=END";
String result = htmlCode.replaceAll("<cite>www\\.youtube\\.com/watch\\?v=", "");
System.out.println(result);

输出：

STARTEND

奖金：

RegexPal是用于测试正则表达式的便捷工具。

java - 使用带有特殊字符的字符串进行拆分

1 回答 1

Related

Reference