问题标签 [utf-32]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 将 UTF-32 字符打印到终端
根据此页面,我正在使用回调(使用 glfwSetCharCallback 设置)从 GLFW 读取用户输入: http ://www.glfw.org/docs/latest/input.html#input_char
回调函数将按下的键作为 32 位无符号整数接收。如何将其转换为可以在屏幕上打印的内容?我已经尝试过来自 C++11 和 ICU 库的 codecvt,但无法将可读字符打印到我的终端。
这是我的回调函数的代码:
如果我对输入(键)不做任何事情,则什么都不会显示。只是一个空行。
c# - C#:读取字符串的第一个字符,当该字符的 unicode 值大于 65535 时
我有一个 C# 方法需要检索字符串的第一个字符,并查看它是否存在于包含特定 unicode 字符(所有从右到左字符)的 HashSet 中。
所以我在做
然后检查哈希集。
问题是此代码不适用于第一个字符的代码点大于 65535 的字符串。
我实际上创建了一个循环,遍历从 0 到 70,000 的所有数字(最高 RTL 代码点约为 68,000,所以我四舍五入),我从数字创建一个字节数组,并使用
用这个字符创建一个字符串。然后我将它传递给在 HashSet 中搜索的方法,该方法失败,因为当它获取
这个价值永远不是它应该的样子。
我究竟做错了什么?
utf - 将值编码为 UTF 32
我正在尝试测试我必须为学校的课程编写的 Unicode 32 解码器程序。我正在寻找一种能够准确地将 UTF 32 字节写入文件的解决方案,以便我可以尝试对它们进行解码。
我一直在尝试开发一种方法来测试它,而不必将 Unicode 编程为 UTF32 编码器(这意味着我也必须测试它)。我一直在使用我在网上找到的一个名为 editpad ( https://www.editpadlite.com/ ) 的程序,它可以让我用 utf32 进行编码。然后我可以在上面测试我的程序。
但是,我会尝试在该程序中编码 U+2A580(unicode 代码点),然后在 linux 中使用终端命令
查看它,并将结果视为:
除了 BOM 之外,这对我来说毫无意义。我只是错误地理解了 UTF32 吗?还是有错误..我希望 UTF32 值类似于 02 a5 80
编辑:我的操作系统是 Linux,特别是 Fedora。Fedora 第 24 版
encoding - 为什么 UTF-32 使用四个字节?
如果 UTF-32 是 UCS-4 限制为 17 个平面(1114111 个字符点),需要 21 位,那么第四个字节在做什么?
c - GCC 和 CLang 无法识别 Unicode 字符串
我正在向 GCC 传递一个 UTF-32 字符串,它抱怨无效的多字节或宽字符。
我在 Clang 中对此进行了测试,并且收到了相同的错误消息。
我最初使用 MSVC 编写了该语句,它运行良好。
这是断言声明。
这是声明。
这是编译命令:
我是否假设 GCC 只能通过转义序列识别 Unicode 字符?
还是我误解了 GCC 和 CLang 如何识别这些字符。
编辑 1
这是错误消息。
编辑 2
现在我更加困惑,因为我试图在一个较小的示例中重新创建错误。
这打印:
这再次证实了我最初认为它的工作方式。
所以我想这意味着我正在使用的库代码中的某个地方存在问题。但我仍然不知道发生了什么。
c# - 如何将 4 字节 unicode 字符插入 mysql 数据库?
当有人试图将笑脸插入我的数据库时,我偶尔会遇到以下异常:
Incorrect string value: '\xF0\x9F\x98\x8A' for column 'name' at row 1
名称定义为
我CharSet=utf8;
在我的连接字符串中使用
我还应该检查/更改完整的 unicode 插入以开始工作吗?
unicode - 使用其他 UNICODE 编码进行通信系统不需要编码/解码吗?
我只是好奇。
当两个系统使用其他Unicode编码(one-UTF-8,other-UTF32)时,不需要编码或解码吗?
我认为这是必要的。但是,我们在 Visual Studio 中只调用 UNICODE。然后,如果有必要(其他应用程序应该编码或解码),它不是标准的。不是吗?
python - 以 UTF-32 编码的单个字符的长度
Wikipedia告诉我 UTF-32 编码使用的位数是 32 位,那么为什么这给了我 64 位的长度呢?
UTF-32 应该是一个 4 字节的固定长度字符集,根据我的理解是每个字符在 32 位内都有固定长度表示它,但是上面代码的输出是 64。这是怎么回事?
julia - 是否可以在 Julia-lang 中使用大字符(UTF32String)连接字符串?
构造 UTF32String (b,c),其中 b 包含较大的值:
现在将 b 和 c 连接到 d 中:
分别阅读 b、c、d。b 保留其值,但 d 被强制转换为 2^16 以下,键入 UTF8String,其值丢失?
在 Julia 0.4 和 0.6 上执行此操作会产生相同的结果。是否有可能解决对带有大字符的字符串进行操作?
c++ - 在使用 UTF8-CPP 从 UTF32 到 UTF8 的对话期间,我收到错误“utf8::invalid_code_point”
我的程序得到一个 utf32 编码的输入中文字符串:
我想将其转换为 utf8,为此我使用库 UTF8-CPP http://utfcpp.sourceforge.net
我在终端中得到了下一个输出:
如何修复此代码,以便会话 utf32to8 成功?我做错了什么,请解释一下?之后,我想将收到的 utf8 写入文件。