问题标签 [utf-32]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

89 问题

0 投票

1 回答

939 浏览

c++ - 将 UTF-32 字符打印到终端

根据此页面，我正在使用回调（使用 glfwSetCharCallback 设置）从 GLFW 读取用户输入： http ://www.glfw.org/docs/latest/input.html#input_char

回调函数将按下的键作为 32 位无符号整数接收。如何将其转换为可以在屏幕上打印的内容？我已经尝试过来自 C++11 和 ICU 库的 codecvt，但无法将可读字符打印到我的终端。

这是我的回调函数的代码：

如果我对输入（键）不做任何事情，则什么都不会显示。只是一个空行。

c++unicode glfw utf-32

2016-09-07T17:33:55.310

0 投票

3 回答

418 浏览

c# - C#：读取字符串的第一个字符，当该字符的 unicode 值大于 65535 时

我有一个 C# 方法需要检索字符串的第一个字符，并查看它是否存在于包含特定 unicode 字符（所有从右到左字符）的 HashSet 中。

所以我在做

然后检查哈希集。

问题是此代码不适用于第一个字符的代码点大于 65535 的字符串。

我实际上创建了一个循环，遍历从 0 到 70,000 的所有数字（最高 RTL 代码点约为 68,000，所以我四舍五入），我从数字创建一个字节数组，并使用

用这个字符创建一个字符串。然后我将它传递给在 HashSet 中搜索的方法，该方法失败，因为当它获取

这个价值永远不是它应该的样子。

我究竟做错了什么？

c#unicode utf-16 utf-32

2016-10-18T16:24:46.513

0 投票

1 回答

368 浏览

utf - 将值编码为 UTF 32

我正在尝试测试我必须为学校的课程编写的 Unicode 32 解码器程序。我正在寻找一种能够准确地将 UTF 32 字节写入文件的解决方案，以便我可以尝试对它们进行解码。

我一直在尝试开发一种方法来测试它，而不必将 Unicode 编程为 UTF32 编码器（这意味着我也必须测试它）。我一直在使用我在网上找到的一个名为 editpad ( https://www.editpadlite.com/ ) 的程序，它可以让我用 utf32 进行编码。然后我可以在上面测试我的程序。

但是，我会尝试在该程序中编码 U+2A580（unicode 代码点），然后在 linux 中使用终端命令

查看它，并将结果视为：

除了 BOM 之外，这对我来说毫无意义。我只是错误地理解了 UTF32 吗？还是有错误..我希望 UTF32 值类似于 02 a5 80

编辑：我的操作系统是 Linux，特别是 Fedora。Fedora 第 24 版

utf utf-32

2017-02-06T17:41:18.760

0 投票

1 回答

185 浏览

encoding - 为什么 UTF-32 使用四个字节？

如果 UTF-32 是 UCS-4 限制为 17 个平面（1114111 个字符点），需要 21 位，那么第四个字节在做什么？

encoding utf-32

2017-02-12T21:58:50.560

0 投票

1 回答

1661 浏览

c - GCC 和 CLang 无法识别 Unicode 字符串

我正在向 GCC 传递一个 UTF-32 字符串，它抱怨无效的多字节或宽字符。

我在 Clang 中对此进行了测试，并且收到了相同的错误消息。

我最初使用 MSVC 编写了该语句，它运行良好。

这是断言声明。

这是声明。

这是编译命令：

我是否假设 GCC 只能通过转义序列识别 Unicode 字符？

还是我误解了 GCC 和 CLang 如何识别这些字符。

编辑 1

这是错误消息。

编辑 2

现在我更加困惑，因为我试图在一个较小的示例中重新创建错误。

这打印：

这再次证实了我最初认为它的工作方式。

所以我想这意味着我正在使用的库代码中的某个地方存在问题。但我仍然不知道发生了什么。

c gcc unicode clang utf-32

2017-02-26T17:58:53.583

0 投票

1 回答

475 浏览

c# - 如何将 4 字节 unicode 字符插入 mysql 数据库？

当有人试图将笑脸插入我的数据库时，我偶尔会遇到以下异常：

Incorrect string value: '\xF0\x9F\x98\x8A' for column 'name' at row 1

名称定义为

我CharSet=utf8;在我的连接字符串中使用

我还应该检查/更改完整的 unicode 插入以开始工作吗？

c#mysql unicode utf-8 utf-32

2017-04-24T12:12:58.390

0 投票

0 回答

26 浏览

unicode - 使用其他 UNICODE 编码进行通信系统不需要编码/解码吗？

我只是好奇。

当两个系统使用其他Unicode编码（one-UTF-8，other-UTF32）时，不需要编码或解码吗？

我认为这是必要的。但是，我们在 Visual Studio 中只调用 UNICODE。然后，如果有必要（其他应用程序应该编码或解码），它不是标准的。不是吗？

unicode encoding utf-8 decoding utf-32

2017-08-22T06:31:00.770

0 投票

1 回答

528 浏览

python - 以 UTF-32 编码的单个字符的长度

Wikipedia告诉我 UTF-32 编码使用的位数是 32 位，那么为什么这给了我 64 位的长度呢？

UTF-32 应该是一个 4 字节的固定长度字符集，根据我的理解是每个字符在 32 位内都有固定长度表示它，但是上面代码的输出是 64。这是怎么回事？

python python-3.x unicode utf-32

2017-10-04T07:58:48.693

0 投票

1 回答

71 浏览

julia - 是否可以在 Julia-lang 中使用大字符（UTF32String）连接字符串？

构造 UTF32String (b,c)，其中 b 包含较大的值：

现在将 b 和 c 连接到 d 中：

分别阅读 b、c、d。b 保留其值，但 d 被强制转换为 2^16 以下，键入 UTF8String，其值丢失？

在 Julia 0.4 和 0.6 上执行此操作会产生相同的结果。是否有可能解决对带有大字符的字符串进行操作？

julia utf-32

2018-01-18T10:00:20.997

0 投票

2 回答

759 浏览

c++ - 在使用 UTF8-CPP 从 UTF32 到 UTF8 的对话期间，我收到错误“utf8::invalid_code_point”

我的程序得到一个 utf32 编码的输入中文字符串：

我想将其转换为 utf8，为此我使用库 UTF8-CPP http://utfcpp.sourceforge.net

我在终端中得到了下一个输出：

如何修复此代码，以便会话 utf32to8 成功？我做错了什么，请解释一下？之后，我想将收到的 utf8 写入文件。

c++linux utf-8 utf-32

2018-01-27T09:00:27.383

1 2 3 4 5 6 7 8 9 10

问题标签 [utf-32]

Reference