问题标签 [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1018 浏览

visual-c++ - UCS2 与 UTF。UCS2编码不能显示哪些语言?

UCS2 在 Visual C++ 中比 UTF 编码更易于使用。UCS2 编码不支持哪些语言?

0 投票
1 回答
432 浏览

mysql - 编码问题:ucs2_bin collat​​e 不支持西里尔语和希腊语

我需要在 Mysql 数据库的字段中存储和比较多种语言的文本。实际上,我将 uc2 设置为字符集,将 ucs_bin 设置为整理,我发现它不适用于西里尔文和希腊字符。
我怎么解决这个问题?有什么建议吗?
在此先感
谢特奥多罗

0 投票
1 回答
750 浏览

c# - 如何将 16 位 UCS-2 整数值转换为 char?

我正在解析二进制文件中的值。我正在解析的一个值是一个 16 位数字,它表示 unicode 字符的 UCS-2 编码。我将它转换为这样的字符:

这安全吗?

0 投票
2 回答
3206 浏览

sql-server - 在 SQL Server nvarchar (UCS-2) 列中存储 C# 字符串 (UTF-16) 的后果是什么?

似乎 SQL Server对字段使用 Unicode UCS-2,一种 2 字节固定长度字符编码。nchar/nvarchar同时,C# 对其字符串使用 Unicode UTF-16编码(注意:有些人不认为 UCS-2 是 Unicode,但它在 Unicode 子集 0-0xFFFF 中编码所有与 UTF-16 相同的代码点,并且作为就 SQL Server 而言,这是与它在字符串方面本机支持的“Unicode”最接近的东西。)

虽然 UCS-2 在基本多语言平面 (BMP) 中编码与 UTF-16 相同的基本代码点,但它不保留 UTF-16 允许代理对的某些位模式。

如果我将 C# 字符串写入 SQL Server nvarchar(UCS-2) 字段并将其读回,这是否总是返回相同的结果?

似乎 UTF-16 是 UCS-2 的超集,因为 UTF-16 编码更多的代码点(例如高于 0xFFFF),但它实际上是 2 字节级别的 UCS-2 的子集,因为它是更严格。

为了回答我自己的问题,我怀疑如果我的 C# 字符串包含高于 0xFFFF 的代码点(由字符对表示),这些将在数据库中很好地存储和检索,但如果我试图在数据库中操作它们(例如也许调用 TOUPPER 或尝试清除所有其他字符),然后我可能会在稍后显示字符串时遇到一些问题......除非 SQL Server 具有确认代理对并将nchar/nvarchar字符串有效地视为 UTF-16 的函数。

0 投票
1 回答
550 浏览

mysql - MySQL不正确的ineger值(编码)

好吧,这是我的错觉。我有一个用 UCS-2 编码的 .rpt 文件,基本上是由“,”分隔的两列。

我的查询是;

文本只是两个 int 列。我不断收到一条错误消息:错误代码:1366 不正确的整数值:第 1 行的列“column1”的“ÿþ1”

我尝试使用 usc-2 默认排序规则创建表,但仍然是同样的问题。我尝试将 .rpt 转换为不同的编码以匹配表格,但没有成功。

谢谢

0 投票
1 回答
1931 浏览

unicode - UCS-2 中也存在的最长的 UTF-8 编码字符(以字节为单位)是什么?

我想知道哪个 Unicode 字符同时出现在 UCS-2 和 UTF-8 编码中,它在 UTF-8 中具有最长的字节大小。

0 投票
1 回答
4076 浏览

perl - 使用 Perl 将数字十六进制格式的 UCS2(未知 LE 或 BE)转换为 UTF-8

希望有人能指出我在哪里出错的方向:

我有一串(我相信的)是十六进制编码的 UCS2,但提供商无法告诉我它是 UCS2-LE 还是 UCS2-BE。

像这样:0627062E062A062806270631

它翻译为:اختبا

显然是阿拉伯语……但无论我是否尝试将其转换为十六进制,将其用作直接的 UCS2(LE 或 BE)或实际上我在阳光下能想到的任何其他东西,我都无法将其转换为本地 - perl UTF-8,以便我可以重新编码为标准 UTF-8(我们系统的本机格式)。

代码:

它现在输出乱码。

现在我想出的一个想法是将有问题的字符串分成 4 个字符的部分(即每个十六进制代码),但即使尝试使用单个已知的 UCS2 十六进制值似乎也不起作用。

还尝试强制输出编码,也没有乐趣。

谢谢!

0 投票
1 回答
22500 浏览

python - python base64字符串解码

我有一个应该是 UCS-2 编码的 xml 文档,经过一些调整后,我设法构建了一个基于 minidom 的 DOM。

问题是我应该有一些在base64上编码的数据。我知道一个事实:

我将如何解码?

http://www.fileformat.info/info/unicode/char/00c1/index.htm显示 Á 的 unicode 表示为:u"\u00C1" 和 UTF-16:0x00C1

节目

作为字符的 unicode 表示,但它看起来是字节交换的。

关于如何解码的任何想法?

0 投票
2 回答
4902 浏览

ios - 谁能告诉我如何在 Objective-c 中将 UTF-8 值转换为 UCS-2 值?

我正在尝试将 UTF-8 字符串转换为 UCS-2 字符串。我需要得到像“\uFF0D\uFF0D\u6211\u7684\u4E0A\u7F51\u4E3B\u9875”这样的字符串。到目前为止,我已经用谷歌搜索了大约一个月,但仍然没有关于将 UTF-8 转换为 UCS-2 的参考。请有人帮助我。提前谢谢。

编辑:好吧,也许我的解释不够好。这是我想要做的。我住在韩国,我正在尝试使用 CTMessageCenter 发送短信。我试图通过我的应用程序发送简体中文。我得到了????而不是正确的字符。所以我也尝试了 UTF-8、UTF-16、BE 和 LE。但是他们都回来了???。最后我发现 SMS 在韩国使用 UCS-2 和 EUC-KR 编码。很奇怪,不是吗?无论如何,我尝试发送像 \u4E3B\u9875 这样的字符串并且它有效。所以我需要先将字符串转换为 UCS-2 编码,然后从这些字符串中获取字符串文字。

0 投票
1 回答
3816 浏览

mysql - 如何将 UCS-2 Little Endian 编码的文件上传到 UTF-8 的 Mysql 表中

我有一个用 UCS-2 Little Endian 编码的 csv 文件,我想将它上传到我的 MySQL 表中,该表用 UTF-8 编码 - 默认排序规则。我很好奇最好的方法是什么。如果我需要编写一个脚本,我可以这样做,尽管我希望有一个简单的解决方案!

谢谢, 弗里兹