0

我正在尝试通过以下方式使用 HtmlEditorKit 保存包含中文字符的 HtmlDocument(使用 UTF-8 编码保存):

try (OutputStreamWriter f = new OutputStreamWriter(fileOutputStream, "UTF-8")) {
    htmlEditorKit.write(f, htmlDocument, 0, htmlDocument.getLength());
} catch (BadLocationException e) {
    logger.error("Could not save", e);
}

在输出 HTML 文档中,我得到两个 2 字节字符(amp#55361;amp#57102;)而不是一个 4 字节字符。Java 可以通过将两者结合起来理解它是哪个符号,但 HTML 不能。
关于如何保存它的任何建议,以便可以正确显示 HTML 页面?

这是输出html:

<html>
<head>
<meta content="text/html" charset="utf-8">
</head>
<body>
<p>&#55361;&#57102;</p>
</body>
</html>

4

0 回答 0