问题标签 [ucs2]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

119 问题

0 投票

2 回答

9586 浏览

java - 用 UCS-2 Little Endian，Java 编写文本文件

我正在尝试编写 .txt 文件，它必须是 UCS-2 Little Endian，但是当我尝试

从我读到的内容应该是相同的，但它不适用于服务器上的特定应用程序。当我在 Notepad++ 中打开工作（手动创建）的文件时，它说它是“UCS-2 Little Endian”，但是当它像这样在 Java 中创建时，它说“UCS-2 LE w/o BO”并且服务器无法读取它。

我怎么能写它才能工作？这是完整的代码：

感谢您的任何建议。

2013-06-13T07:54:32.367

0 投票

1 回答

30 浏览

mysql - mysql 不区分 e 和 è

mysql 数据库中有两个使用 ucs2_slovenian_ci 的表（我无法更改）。如何使 sql 能够识别 'e' 和 'è' 之间的差异，并且不会将这些行与不同的值连接起来？

不起作用。谢谢你的帮助

mysql ucs2

2013-06-30T15:25:33.493

0 投票

1 回答

1713 浏览

git - 在 Git 中追溯将 UCS-2 文件转换为 UTF-8

我的 Git 存储库中有一个包含多个提交的文件，该文件以 16 位 Unicode (UCS-2) 编码，供 Windows 使用。

因此，Git 将其视为二进制文件，而不是文本文件，我看不到不同提交所做的更改。

有没有办法将该文件追溯转换为 UTF-8，即重建历史，就好像该文件一直是 UTF-8 一样，我一直将它作为 UTF-8 文件提交，而不是 16 位 Unicode文件？

git utf-8 ucs2

2013-09-19T12:52:56.353

0 投票

2 回答

1442 浏览

unicode - UCS-2 如何在 UTF-8 中显示占用 6 个字节的 unicode 代码点？

我在http://www.joelonsoftware.com/articles/Unicode.html阅读有关 unicode 的信息。Joel 说 UCS-2 将所有 unicode 字符编码为 2 个字节，而 UTF-8 可能需要多达 6 个字节来编码一些 unicode 字符。您能否举个例子来解释一下，UCS-2 中如何对 6 字节 UTF-8 编码的 unicode 字符进行编码？

unicode utf-8 ucs2

2013-11-26T14:18:26.927

0 投票

1 回答

993 浏览

android - UCS-2 为 android 启用 0 类短信

我正在寻找一种方法来发送 0 类短信而不会弄乱 UCS-2 编码。

线程Class 0 SMS (flash SMS) on Android中的答案似乎与 UCS-2 编码混淆，因为正常文本可以很好地发送和接收，但需要 UCS-2 编码的语言显示为垃圾字符。

发送时，

在这两种情况下，都收到了。

两者，[线程中的第二个答案，stackoverflow.com/a/9424185/3082310]

而且，[ZeroSMS，github.com/virtualabs/ZeroSMS]

似乎给出了相同的结果。

关于问题出在哪里的任何想法？

android sms ucs2

2013-12-12T00:08:32.960

0 投票

1 回答

1113 浏览

c++ - 使用 icu 库进行 UTF-8 到 UCS-2 的转换

我目前正在处理使用 icu 库将 UTF-8 字符串转换为 UCS-2 字符串的问题。在库中有几种方法可以做到这一点，但到目前为止，它们似乎都没有奏效，但考虑到这个库的受欢迎程度，我假设我做错了什么。

首先是通用代码。在所有情况下，我都在对象上创建和传递一个字符串，但在它到达转换步骤之前，没有任何操作。

当前使用的 utf-8 字符串只是“ĩ”。

为简单起见，我将表示uniString此代码中使用的字符串

问题是该ucnv_fromAlgorithmic函数为 ucs-2 转换引发错误U_INVALID_CHAR_FOUND。这对尝试有意义ISO-8859-1，但对 ucs-2 没有意义。

另一种尝试是使用ucnv_convert你可以看到被注释掉的。此函数尝试转换，但尝试并没有失败ISO-8859-1。

所以问题是，有没有人有使用这些功能的经验并看到不正确的地方，或者对于这个字符的转换假设有什么不正确的地方吗？

c++unicode utf-8 icu ucs2

2014-03-05T21:35:33.897

0 投票

1 回答

1277 浏览

c++ - 使用 icu 将 UTF-8 转换为 UCS2 导致乱码

这是上一个问题的后续问题

该问题中的问题已解决，现在代码按预期进行，但是 utf-8 到 ucs2 转换的最终输出是乱码。我的意思是最终文本的十六进制值无论如何都与 utf-8 版本不对应。我知道它们是不同的编码，但两者之间似乎没有任何映射。

转换的输入是“ĩ”，输出是“ÿþ)^A”。在十六进制中，“ĩ”（utf-8 值）的值为 c4a9，“ÿþ)^A”（ucs2 值）的值为“00FF 00FE 0029 0001”。

我希望有人对此行为有解释，或者可以告诉我我在代码中做错了什么。

新更新的代码是：

c++unicode utf-8 icu ucs2

2014-03-06T15:17:21.857

0 投票

0 回答

92 浏览

php - 将中文单字加载到数组中

我有一个包含多行用逗号分隔的中文单词的文件，,如下所示：

我想使用以下代码将它们加载到数组中，稍后我可以使用该数组来查找文章中包含的中文单词：

我的问题：

什么$_SP_ = chr(0xFF).chr(0xFE) mean?chr(0xFF).chr(0xFE)是从 ASCII 的最后两个字符中检索的字符串，这两者的组合是为了什么？
为什么我应该将ucs-2b的SP转换为 utf-8 格式？
为什么$ws再次被转换为字符串但由chr(0xFF).chr(0xFE)utf-8 类型分隔。
为什么它需要每个单词的长度？
为什么$spstr是UCS-2be类型，只因为它是的组合chr(0xFF).chr(0xFE)？

php utf-8 ucs2

2014-03-21T17:18:03.783

0 投票

1 回答

5247 浏览

java - UCS-2 的 java.io.UnsupportedEncodingException

我有一些匈牙利语文本，我希望使用 UCS2 编码对其进行编码

但我收到以下异常

有什么问题？

编辑

我使用以下命令来运行我的 jar 实际上我的命令就像

java -Dfile.encoding=UCS-2 -cp MyApp.jar com.sms.Main "9876543210" “UCS-2” > testApp.log

还有应该使用的正确编码是什么，我使用了 UTF-8，但输出不正确。

java exception ucs2

2014-04-16T05:39:21.710

0 投票

1 回答

2047 浏览

c# - USSD接收消息解码

我正在向调制解调器发送 AT+CUSD 命令，当我收到此消息时，我无法理解它，也无法以任何方式对其进行解码，请我需要帮助。这是一个样本

您看到的第一个是可读的，dcs 是 15，但另一个不是，并且 dcs 是 72 帮助！

c#decode at-command ussd ucs2

2014-04-16T07:30:48.620

1 2 3 4 5 6 7 8 9 10

问题标签 [ucs2]

Reference