1

我已经看过有关此问题的其他一些帖子,但无法找到有关如何以编程方式确定代码点是否使用超过一个 2 字节(在 Windows 上)wchar_t 的任何详细信息。

一个例子:

const wchar_t* s2 = L"\U0002008A"; // The "Han" character
std::wstring in(s2);               // length() == 2

我想知道如何确定一个字符何时长度()> 1。

4

1 回答 1

4

任何高于 U+FFFF 的代码点都在其 UTF-16 编码中使用代理项。替代值在 D800-DFFF 范围内。

于 2013-04-18T16:42:49.473 回答