问题标签 [ucs2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
9586 浏览

java - 用 UCS-2 Little Endian,Java 编写文本文件

我正在尝试编写 .txt 文件,它必须是 UCS-2 Little Endian,但是当我尝试

从我读到的内容应该是相同的,但它不适用于服务器上的特定应用程序。当我在 Notepad++ 中打开工作(手动创建)的文件时,它说它是“UCS-2 Little Endian”,但是当它像这样在 Java 中创建时,它说“UCS-2 LE w/o BO”并且服务器无法读取它。

我怎么能写它才能工作?这是完整的代码:

感谢您的任何建议。

0 投票
1 回答
30 浏览

mysql - mysql 不区分 e 和 è

mysql 数据库中有两个使用 ucs2_slovenian_ci 的表(我无法更改)。如何使 sql 能够识别 'e' 和 'è' 之间的差异,并且不会将这些行与不同的值连接起来?

不起作用。谢谢你的帮助

0 投票
1 回答
1713 浏览

git - 在 Git 中追溯将 UCS-2 文件转换为 UTF-8

我的 Git 存储库中有一个包含多个提交的文件,该文件以 16 位 Unicode (UCS-2) 编码,供 Windows 使用。

因此,Git 将其视为二进制文件,而不是文本文件,我看不到不同提交所做的更改。

有没有办法将该文件追溯转换为 UTF-8,即重建历史,就好像该文件一直是 UTF-8 一样,我一直将它作为 UTF-8 文件提交,而不是 16 位 Unicode文件?

0 投票
2 回答
1442 浏览

unicode - UCS-2 如何在 UTF-8 中显示占用 6 个字节的 unicode 代码点?

我在http://www.joelonsoftware.com/articles/Unicode.html阅读有关 unicode 的信息。Joel 说 UCS-2 将所有 unicode 字符编码为 2 个字节,而 UTF-8 可能需要多达 6 个字节来编码一些 unicode 字符。您能否举个例子来解释一下,UCS-2 中如何对 6 字节 UTF-8 编码的 unicode 字符进行编码?

0 投票
1 回答
993 浏览

android - UCS-2 为 android 启用 0 类短信

我正在寻找一种方法来发送 0 类短信而不会弄乱 UCS-2 编码。

线程Class 0 SMS (flash SMS) on Android中的答案似乎与 UCS-2 编码混淆,因为正常文本可以很好地发送和接收,但需要 UCS-2 编码的语言显示为垃圾字符。

IE

发送时,http://i.stack.imgur.com/xTX8m.png

在这两种情况下,http://i.stack.imgur.com/UcYxS.png 都收到了。

两者,[线程中的第二个答案,stackoverflow.com/a/9424185/3082310]

而且,[ZeroSMS,github.com/virtualabs/ZeroSMS]

似乎给出了相同的结果。

关于问题出在哪里的任何想法?

0 投票
1 回答
1113 浏览

c++ - 使用 icu 库进行 UTF-8 到 UCS-2 的转换

我目前正在处理使用 icu 库将 UTF-8 字符串转换为 UCS-2 字符串的问题。在库中有几种方法可以做到这一点,但到目前为止,它们似乎都没有奏效,但考虑到这个库的受欢迎程度,我假设我做错了什么。

首先是通用代码。在所有情况下,我都在对象上创建和传递一个字符串,但在它到达转换步骤之前,没有任何操作。

当前使用的 utf-8 字符串只是“ĩ”。

为简单起见,我将表示uniString此代码中使用的字符串

问题是该ucnv_fromAlgorithmic函数为 ucs-2 转换引发错误U_INVALID_CHAR_FOUND。这对尝试有意义ISO-8859-1,但对 ucs-2 没有意义。

另一种尝试是使用ucnv_convert你可以看到被注释掉的。此函数尝试转换,但尝试并没有失败ISO-8859-1

所以问题是,有没有人有使用这些功能的经验并看到不正确的地方,或者对于这个字符的转换假设有什么不正确的地方吗?

0 投票
1 回答
1277 浏览

c++ - 使用 icu 将 UTF-8 转换为 UCS2 导致乱码

这是上一个问题的后续问题

该问题中的问题已解决,现在代码按预期进行,但是 utf-8 到 ucs2 转换的最终输出是乱码。我的意思是最终文本的十六进制值无论如何都与 utf-8 版本不对应。我知道它们是不同的编码,但两者之间似乎没有任何映射。

转换的输入是“ĩ”,输出是“ÿþ)^A”。在十六进制中,“ĩ”(utf-8 值)的值为 c4a9,“ÿþ)^A”(ucs2 值)的值为“00FF 00FE 0029 0001”。

我希望有人对此行为有解释,或者可以告诉我我在代码中做错了什么。

新更新的代码是:

0 投票
0 回答
92 浏览

php - 将中文单字加载到数组中

我有一个包含多行用逗号分隔的中文单词的文件,,如下所示:

我想使用以下代码将它们加载到数组中,稍后我可以使用该数组来查找文章中包含的中文单词:

我的问题:

  1. 什么$_SP_ = chr(0xFF).chr(0xFE) mean?chr(0xFF).chr(0xFE)是从 ASCII 的最后两个字符中检索的字符串,这两者的组合是为了什么?

  2. 为什么我应该将ucs-2b的SP转换为 utf-8 格式?

  3. 为什么$ws再次被转换为字符串但由chr(0xFF).chr(0xFE)utf-8 类型分隔。

  4. 为什么它需要每个单词的长度?

  5. 为什么$spstr是UCS-2be类型,只因为它是的组合chr(0xFF).chr(0xFE)

0 投票
1 回答
5247 浏览

java - UCS-2 的 java.io.UnsupportedEncodingException

我有一些匈牙利语文本,我希望使用 UCS2 编码对其进行编码

但我收到以下异常

有什么问题?

编辑

我使用以下命令来运行我的 jar 实际上我的命令就像

java -Dfile.encoding=UCS-2 -cp MyApp.jar com.sms.Main "9876543210" “UCS-2” > testApp.log

还有应该使用的正确编码是什么,我使用了 UTF-8,但输出不正确。

0 投票
1 回答
2047 浏览

c# - USSD接收消息解码

我正在向调制解调器发送 AT+CUSD 命令,当我收到此消息时,我无法理解它,也无法以任何方式对其进行解码,请我需要帮助。这是一个样本

您看到的第一个是可读的,dcs 是 15,但另一个不是,并且 dcs 是 72 帮助!