问题标签 [utf-32]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
416 浏览

testing - UTF16/32 测试用例(需要负测试用例)

我想要/需要一个测试用例来测试/破坏 UTF-32 和 UTF-16 之间的转换。

对于 UTF-8 和 UTF-16,我一般使用 'Chinese Bone' 测试:0xE9 0xAA 0xA8 (UTF8) 和 0x9AA8 (UTF16)。

有没有人有一个负面的测试用例应该破坏 UTF-16 和 UTF-32 的编写不佳的实现?理想情况下,测试将需要使用至少两个 UTF-32 值。

杰夫

0 投票
2 回答
6250 浏览

c++ - 将 char32_t 打印到控制台

如何在 C++11 中将( cout/ / ...) char32_t 打印到控制台?wcout

以下代码打印十六进制值:

0 投票
1 回答
153 浏览

erlang - Erlang 中的 UTF-32 编码

我想用 wxErlang 创建一个应用程序,其中我需要使用 UTF-32 字符串。我可以使用 UTF-8 编码从文件中加载源代码,但是当文件转换为 UTF-32 时出现错误。我需要在我的应用程序中使用西里尔字符,这就是我想用 UTF-32 编码解决这个问题的原因。

0 投票
2 回答
1219 浏览

unicode - utf-32优势说明

在在线的diveintopython3一书中,它说utf-32和utf-16的优点是

UTF-32 是一种简单的编码;它接受每个 Unicode 字符(一个 4 字节的数字)并表示具有相同数字的字符。这有一些优点,最重要的是您可以在恒定时间内找到字符串的第 N 个字符,因为第 N 个字符从 4×Nth 字节开始

有人可以解释一下吗?如果可能的话,举个例子……我不确定我是否完全理解

0 投票
1 回答
201 浏览

android - 下载的非英文 html 文件在 webview 中不可读

保存(马拉雅拉姆语)字符串内容代码

它运行良好

但是当我从服务器下载后执行相同的操作时它不起作用(字符在 webview 中不可读),

找到下面的代码,

我认为问题在于从服务器到安卓的数据传输,我能做什么?
base 64 传输编码能解决这个问题吗?
请帮忙

0 投票
1 回答
366 浏览

c# - 解码“奇怪”的 utf32 格式

我有一个包含从数据库读取的 UTF32 的文件。我希望 "Hi" 变成H\0\0\0i\0\0\0,但实际上是\0\0\0H\0\0\0i,前面有空字符。

有谁知道这是怎么发生的,以及我如何才能在保持所有数据完好无损的情况下对其进行解码?

0 投票
1 回答
124 浏览

c - 检查文件是否仅包含 < 10 位字符

这是家庭作业。我不是在寻找代码只是讨论,关于如何进行的高级建议。

我目前正在处理一项任务,我们将文件中的 UTF-16 字符转换为输出文件中的 UTF-32,反之亦然。作业说,第一步是处理仅包含小于 10 位字符的文件,但我很难过。这是我们的第一个任务,虽然我使用过 C++,但从未真正使用过 C。

我一直在阅读有关此类转换的 RFC (S.2.1),我觉得我非常了解它。我知道 UTF-32 字符实际上是 10 位,前面是 6 位定义它的组成(我相信 110110 表示第一对 16 位,110111 表示第二对“32”)。UTF-16 字符是否以 6 个前导 0 开头?

还是 UTF-16 字符小于 10 位,一旦你遇到 10 位字符,你就知道你遇到了 UTF-32 位字符?

我想我真正的问题是当它可以是 8、16 等时,“10 位字符”是什么意思。但是对我提到的任何内容的任何见解都会很棒!

0 投票
1 回答
143 浏览

utf-16 - 是否应该为空字符串(UTF-16 和 UTF-32)添加 BOM(字节顺序标记)?

排除 UTF-8,是否有一般的理解或不言而喻的约定,如果字符串为空,编码器可以(应该)安全地省略 BOM。

空字符串似乎是一种浪费,尤其是在发送到服务器时。在这种情况下,编码类型和字节顺序将无关紧要。

是否有专门针对空字符串的 BOM 的 RFC?

谢谢你。

0 投票
1 回答
211 浏览

encoding - 一个短语在不同的编码中有多少字节

任务是 - 考虑西班牙语短语

在 ISO-8859-1 编码中它将有多少字节?UTF-8 有多少个?UTF-16 有多少个?UTF-32 有多少个?

我的解决方案是

那正确吗?

0 投票
2 回答
801 浏览

ios - 将 NSString 转换为 NSUTF32StringEncoding

我有一个内部使用 UTF16 编码的 NSString。我想将其转换为使用 UTF32 ,以便 or q两者都采用单个索引。Currenty 需要 2。

这个怎么做 ?。即使我可以从 NSString 转换为其他类型,它也会起作用。底线是 or q在数组中采用相同数量的索引。