为了补充另一个答案,\u
转义在 Java 中有一个有趣的属性,它们实际上是由编译器预处理的( JLS §3.3)。
我的意思是在进入编译器之前\u
在源文件中替换字符。因此,您的代码:
public String expectedJSONWithHTMLValues(){
return "{" +
"\"someHtml\":{" +
"\"html\":\"\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E\"}}";
}
正在被预处理为:
public String expectedJSONWithHTMLValues(){
return "{" +
"\"someHtml\":{" +
"\"html\":\"<html>HTML&CSS</html>\"}}";
}
这就是正在编译的内容。
Java 编译器将\u
在实际编译文件之前将任何转义转换为字符。这意味着\u
转义可以用于变量名、类名、方法名等。编译器会将其转化为字符本身并在编译过程中使用。这就是为什么你应该\n
在你的字符串中使用而不是\u000a
. 如果您使用后者,源代码将来自以下内容:
String s = "My\u000aNewline";
对此:
String s = "My
Newline";
这将导致编译器错误,因为String
文字被分成多行。
这可以让你做一些非常糟糕的事情。例如,这是 100% 合法的 Java 代码,可以在任何操作系统上编译:
\u0070\u0075\u0062\u006c\u0069\u0063 \u0063\u006c\u0061\u0073\u0073 \u004d\u0061\u0069\u006e \u007b
\u0070\u0072\u0069\u0076\u0061\u0074\u0065 \u0073\u0074\u0061\u0074\u0069\u0063 \u0053\u0074\u0072\u0069\u006e\u0067 \u0073\u006f\u006d\u0065\u0053\u0074\u0072\u0069\u006e\u0067 \u003d \u0022\u004d\u0079 \u0053\u0074\u0072\u0069\u006e\u0067\u0022\u003b
\u0070\u0075\u0062\u006c\u0069\u0063 \u0073\u0074\u0061\u0074\u0069\u0063 \u0076\u006f\u0069\u0064 \u006d\u0061\u0069\u006e\u0028\u0053\u0074\u0072\u0069\u006e\u0067\u005b\u005d \u0061\u0072\u0067\u0073\u0029 \u007b
\u0053\u0079\u0073\u0074\u0065\u006d\u002e\u006f\u0075\u0074\u002e\u0070\u0072\u0069\u006e\u0074\u006c\u006e\u0028\u0073\u006f\u006d\u0065\u0053\u0074\u0072\u0069\u006e\u0067\u0029\u003b
\u007d
\u007d
它打印:
My String
不相信我?你自己看。编译器首先将所有\u
转义转换为字符,然后将所有 like\u0070\u0072\u0069\u0076\u0061\u0074\u0065
转换为private
或。\u0073\u0074\u0061\u0074\u0069\u0063\u0053\u0074\u0072\u0069\u006e\u0067
String
无论如何,要解决您的特定问题,您需要做的就是双重转义,\
如下所示:
public String expectedJSONWithHTMLValues(){
return "{" +
"\"someHtml\":{" +
"\"html\":\"\\u003Chtml\\u003EHTML\\u0026CSS\\u003C/html\\u003E\"}}";
}
还值得注意的是,这个字符串:
{"someHtml":{"html":"\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E"}}
不等于此字符串,其中添加了空格:
{
"someHtml": {
"html": "\u003Chtml\u003EHTML\u0026CSS\u003C/html\u003E"
}
}
String.equals
将在等式中包含空格,因此请确保您的两个字符串逐个字符相同,包括空格。