0

我有一个包含一些特殊字符的字符串,例如“\u2012”,即图形破折号。当我试图在控制台上打印这个时,我得到一个“?” 标记而不是其符号。我有一个编辑器,我可以在其中使用 alt+numpad 插入符号,例如 alt+2012。在编辑器中,我可以看到符号将其保存在 xml 文件中并使用 nodevalue 获取值,我得到一个“?” 标记。
总结一下,我面临阅读扩展拉丁字符集的问题。我需要的是当我插入这些符号并阅读它时,我应该得到类似 &#xXXXX; 的东西。请帮忙!

蒂亚:)

只是我有一个 String inpath = "À";,我想得到它的 unicode 值..like &#xXXXX;

4

1 回答 1

0

Windows 中的默认控制台编码是一些 MS-DOS 代码页,它们不支持该字符。您可以在运行程序之前尝试运行chcp 65001,但您可能还需要更改控制台字体。

只要您使用 UTF-8,您就不需要对任何其他字符做任何您不会做的事情。你在很多地方都没有这样做。您需要在代码中明确写入以 UTF-8 保存和读取文件,而不是依赖平台默认编码。

于 2013-01-18T05:46:52.450 回答