问题标签 [utf-32]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unicode - 记事本可以读取 UTF-32 吗?
这些字节代表 UTF-32LE 中的单词“hi”:
然而,这是记事本显示的内容:
java - 确定 UTF-32 编码的字符串是否具有唯一字符
我有一个关于使用位向量方法来查找字符串是否具有唯一字符的问题。我已经看到那些解决方案(其中之一)适用于 ASCII 和 UTF-16 字符集。
但是,相同的方法将如何适用于 UTF-32?Java中最长的连续位向量可以是长变量吗?UTF-16 需要 1024 个这样的变量。如果我们采用相同的方法,它将需要 2^26 个长变量(我认为)。是否可以使用位向量来解决如此大的字符集?
unicode - 真正的双字节编码
存在一些真正的双字节编码(DBCS)吗?
- 除了 UCS-2,当然还有 UTF-16。
- 我的意思是编码,它也将 ASCII 保存为 2 个字节。
- 我的意思是空字节。(00 20 - 空格)
- 请告诉它是否已使用,是否在标准/使用中已过时。
4字节编码的相同问题是否存在(不是UCS-4,UTF-32)?
谢谢。
javascript - 从 UTF-32 字符中清除 JS 中的字符串
我需要从 JS 中的字符串中清除以 UTF-32 编码的字符,例如“”。我尝试使用代码:
但这行不通。
unicode - 将 Unicode 转换为 UTF 32
如何转换U+0065
为 UTF-32 格式?
将 U+0065 转换为 UTF-32:
十六进制的结果是0x00000065
那是对的吗 ?
java - 将 __int64 转换为 std::u32string
我正在编写一个使用 Casablanca REST API 的本机 Windows C++ 应用程序。我正在尝试将整数值从 C++ 应用程序传递到将在云中运行的 Java servlet。在进行GET
REST 调用时,Casablanca API 要求我使用 anstd::u32string
来存储查询参数。对我来说,为什么要使用 UTF-32 编码来确保可以支持每种类型的字符,这有点直观。对我来说不直观的是如何进行这种转换。
这是我当前的代码:
一旦我收到这个 UTF-32 编码的字符串,我也不完全确定我应该如何处理 Java 端的事情。任何专业的 C++ 建议都将在此不胜感激。
unicode - 怎么会有固定宽度的 Unicode 编码?
在阅读 Unicode 时,我多次听说 UTF-32 是一种固定宽度编码。
采用固定宽度编码来表示“将源符号映射到一组比特的代码”,并且假设所讨论的源符号是 Unicode 代码点,这一切都是有道理的。但是,如果您认为源符号的底层语言是字素,事情就会变得复杂得多。
所以我的问题是,就字素而言,UTF-32 真的是一种固定长度的编码吗?如果没有,在这个意义上是否有可能的固定长度编码?
java - java getBytes vs getBytes(charset) 的奇怪行为
考虑以下:
输出:
所以我有两个问题:
- 在这两个部分中:为什么输出
getBytes()
和getBytes(charSet)
不同,即使我已经特别提到了字符串的字符集 - 为什么 utf-32 部分的两个字节输出
getByte
都与实际不同byte[] b
?(即如何将字符串转换回其原始字节数组?)
utf-32 - UTF-32,为什么要占8个字节?
我最近一直在阅读有关 Unicode 的所有内容,因为它的工作原理非常有趣。
所以我读过这UTF-32
是一个固定的 4 个字节。好吧,我觉得这很奇怪,当我在我的两台 MacBook Air 上保存一个简单的文件时,其中有一个字母 (t),它保存了 8 个字节。这也发生在UTF-16
,它占用了 4 个字节(虽然不是很奇怪)。有谁知道为什么?
注意:我确实检查过,里面没有空格
c# - No UTF-32 big-endian in C#?
In C#, Encoding.UTF32
is UTF-32 little-endian, Encoding.BigEndianUnicode
is UTF-16 big-endian, Encoding.Unicode
is UTF-16 little-endian. But I can't find any for UTF-32 big-endian.
I'm developing a simple textviewer and don't think there are many documents encoded in UTF-32 big-endian but I want to prepare for that too, just in case.
Doesn't C# support UTF32 big-endian?
BTW Java supports it.