问题标签 [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 用 UCS-2 Little Endian,Java 编写文本文件
我正在尝试编写 .txt 文件,它必须是 UCS-2 Little Endian,但是当我尝试
从我读到的内容应该是相同的,但它不适用于服务器上的特定应用程序。当我在 Notepad++ 中打开工作(手动创建)的文件时,它说它是“UCS-2 Little Endian”,但是当它像这样在 Java 中创建时,它说“UCS-2 LE w/o BO”并且服务器无法读取它。
我怎么能写它才能工作?这是完整的代码:
感谢您的任何建议。
mysql - mysql 不区分 e 和 è
mysql 数据库中有两个使用 ucs2_slovenian_ci 的表(我无法更改)。如何使 sql 能够识别 'e' 和 'è' 之间的差异,并且不会将这些行与不同的值连接起来?
不起作用。谢谢你的帮助
git - 在 Git 中追溯将 UCS-2 文件转换为 UTF-8
我的 Git 存储库中有一个包含多个提交的文件,该文件以 16 位 Unicode (UCS-2) 编码,供 Windows 使用。
因此,Git 将其视为二进制文件,而不是文本文件,我看不到不同提交所做的更改。
有没有办法将该文件追溯转换为 UTF-8,即重建历史,就好像该文件一直是 UTF-8 一样,我一直将它作为 UTF-8 文件提交,而不是 16 位 Unicode文件?
unicode - UCS-2 如何在 UTF-8 中显示占用 6 个字节的 unicode 代码点?
我在http://www.joelonsoftware.com/articles/Unicode.html阅读有关 unicode 的信息。Joel 说 UCS-2 将所有 unicode 字符编码为 2 个字节,而 UTF-8 可能需要多达 6 个字节来编码一些 unicode 字符。您能否举个例子来解释一下,UCS-2 中如何对 6 字节 UTF-8 编码的 unicode 字符进行编码?
android - UCS-2 为 android 启用 0 类短信
我正在寻找一种方法来发送 0 类短信而不会弄乱 UCS-2 编码。
线程Class 0 SMS (flash SMS) on Android中的答案似乎与 UCS-2 编码混淆,因为正常文本可以很好地发送和接收,但需要 UCS-2 编码的语言显示为垃圾字符。
IE
发送时,
在这两种情况下, 都收到了。
两者,[线程中的第二个答案,stackoverflow.com/a/9424185/3082310]
而且,[ZeroSMS,github.com/virtualabs/ZeroSMS]
似乎给出了相同的结果。
关于问题出在哪里的任何想法?
c++ - 使用 icu 库进行 UTF-8 到 UCS-2 的转换
我目前正在处理使用 icu 库将 UTF-8 字符串转换为 UCS-2 字符串的问题。在库中有几种方法可以做到这一点,但到目前为止,它们似乎都没有奏效,但考虑到这个库的受欢迎程度,我假设我做错了什么。
首先是通用代码。在所有情况下,我都在对象上创建和传递一个字符串,但在它到达转换步骤之前,没有任何操作。
当前使用的 utf-8 字符串只是“ĩ”。
为简单起见,我将表示uniString
此代码中使用的字符串
问题是该ucnv_fromAlgorithmic
函数为 ucs-2 转换引发错误U_INVALID_CHAR_FOUND
。这对尝试有意义ISO-8859-1
,但对 ucs-2 没有意义。
另一种尝试是使用ucnv_convert
你可以看到被注释掉的。此函数尝试转换,但尝试并没有失败ISO-8859-1
。
所以问题是,有没有人有使用这些功能的经验并看到不正确的地方,或者对于这个字符的转换假设有什么不正确的地方吗?
c++ - 使用 icu 将 UTF-8 转换为 UCS2 导致乱码
这是上一个问题的后续问题
该问题中的问题已解决,现在代码按预期进行,但是 utf-8 到 ucs2 转换的最终输出是乱码。我的意思是最终文本的十六进制值无论如何都与 utf-8 版本不对应。我知道它们是不同的编码,但两者之间似乎没有任何映射。
转换的输入是“ĩ”,输出是“ÿþ)^A”。在十六进制中,“ĩ”(utf-8 值)的值为 c4a9,“ÿþ)^A”(ucs2 值)的值为“00FF 00FE 0029 0001”。
我希望有人对此行为有解释,或者可以告诉我我在代码中做错了什么。
新更新的代码是:
php - 将中文单字加载到数组中
我有一个包含多行用逗号分隔的中文单词的文件,,
如下所示:
我想使用以下代码将它们加载到数组中,稍后我可以使用该数组来查找文章中包含的中文单词:
我的问题:
什么
$_SP_ = chr(0xFF).chr(0xFE) mean?chr(0xFF).chr(0xFE)
是从 ASCII 的最后两个字符中检索的字符串,这两者的组合是为了什么?为什么我应该将ucs-2b的SP转换为 utf-8 格式?
为什么
$ws
再次被转换为字符串但由chr(0xFF).chr(0xFE)
utf-8 类型分隔。为什么它需要每个单词的长度?
为什么
$spstr
是UCS-2be类型,只因为它是的组合chr(0xFF).chr(0xFE)
?
java - UCS-2 的 java.io.UnsupportedEncodingException
我有一些匈牙利语文本,我希望使用 UCS2 编码对其进行编码
但我收到以下异常
有什么问题?
编辑
我使用以下命令来运行我的 jar 实际上我的命令就像
java -Dfile.encoding=UCS-2 -cp MyApp.jar com.sms.Main "9876543210" “UCS-2” > testApp.log
还有应该使用的正确编码是什么,我使用了 UTF-8,但输出不正确。
c# - USSD接收消息解码
我正在向调制解调器发送 AT+CUSD 命令,当我收到此消息时,我无法理解它,也无法以任何方式对其进行解码,请我需要帮助。这是一个样本
您看到的第一个是可读的,dcs 是 15,但另一个不是,并且 dcs 是 72 帮助!