问题标签 [ucs2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 将 Utf8 转换为 UCS2 字节数组
我正在寻找将 UTF8(孟加拉语字符)转换为 UCS2 字节数组的代码示例。我有直接的方法来解决这个问题吗?不知何故,我得到了 UCS2 转换,但不是在字节数组中的字符串值。
例如:
我的返回输出应该是这样的。
谢谢
php - 如何将 Unicode 文本块转换为 UTF-8 (HEX) 代码点?
我有一个 Unicode 文本块,如下所示:
现在,我想将此原始 Unicode 文本块转换为 UTF-8 (HEX) 代码点的文本块(请参阅此页面上的十六进制 UTF-8列:https ://en.wikipedia.org/wiki /UTF-8 ), 由PHP
; 像这样:
不像这样:
有什么办法可以通过 PHP 做到这一点吗?
我已经阅读了这个主题(PHP: Convert unicode codepoint to UTF-8)。但是,它与我的问题不相似。
对不起,我不太了解Unicode
。
php - 如何通过这种方式在 PHP 中使用 HTML 将“UCS-2”转换为“UTF-8”?
我有一个 HTML 表单,它在ISO-8859-1中设置。现在,我想将UCS-2
字符串转换为UTF-8
字符串;此输出UTF-8
将打印到<input type="text" name="out" />
. 并且,我的 HTML 表单中的字符集不得更改。
我已经阅读了这些问题:
我尝试通过以下代码解决我的问题:
当我在UCS-2中输入一个单词时,例如:Việt Nam
,它将返回:�V�i�&�#�7�8�7�9�;�t� �N�a�m
。为什么?
有没有办法通过 PHP 将 UCS-2 转换为 UTF-8;然后,输出到<input type="text" name="out" />
?
utf-8 - UCS-2 Little Endian 到 UTF-8 的转换会留下包含许多不需要的字符的文件
我有一个脚本,我在经历了许多不同的方式后组合在一起,我可以在 VBScript 中使用 ADODB 进行编码转换。
该文件应该从 UCS-2 Little Endian 或它所采用的任何可读格式(在限制范围内)转换为 UTF-8。然而问题是,一旦此文件完成转换为 UTF-8 NUL
,整个文件中的每个字母前后都会有许多符号,以及文件开头的xFF
xFE
(UCS-2 LE BOM)。这些是可见的,无需使用任何符号可视化切换。任何帮助将不胜感激,以了解我可能在此转换中受到限制。或者我可以采取的任何替代方法。
php - 如何在 PHP 中将 UCS-2 文本文件读取为 UTF-8 字符串?
我有一个 UCS-2 文本文件。现在,我想将此文本文件作为 UTF-8 字符串读取。我已经使用此代码来执行此操作。
my_code.php:
viet_test.txt:
但是,它返回错误:��"Vietnamese" is "Ti�ng Vi�t".
。这就是我想要的:("Vietnamese" is "Tiếng Việt"
在 UTF-8 中)。
你能告诉我:“我的代码有什么问题?以及,如何解决它?”。
对不起,我对 PHP 不是很专业。
python - “UCS-2”编解码器无法对位置 1050-1050 中的字符进行编码
当我运行我的 Python 代码时,我收到以下错误:
这是我的代码:
我怎样才能解决这个问题?
javascript - 如何在nodejs中将UTF16文件转换为UTF8文件
我有一个以 UTF16 编码的 xml 文件,我想将其转换为 UTF8 以便处理它。如果我使用这个命令:
该文件已正确转换,我能够处理它。我想在 nodejs 中做同样的事情。
目前我有一个文件缓冲区,我已经尝试了所有我能想到的以及我在互联网上可以找到的所有内容,但没有成功。
以下是我迄今为止尝试过的一些示例:
我也尝试过使用这些功能:
http://jonisalonen.com/2012/from-utf-16-to-utf-8-in-javascript/ https://stackoverflow.com/a/14601808/1405208
第一个没有任何改变,链接只给我汉字。
python - 正则表达式匹配 '\uFFFF' 以上的所有 unicode 字符
当我得到 UCS-4 字符时,Pygame 和 Pyglet 都崩溃了:
exceptions.UnicodeError:发现 '\uFFFF' 上方的 Unicode 字符;不支持
如何使用正则表达式过滤所有这些字符?
php - PHP 将字符串从 UCS-2LE 转换为 UTF-8
我目前正在做一个项目,我需要按顺序(256 字节)读取包含语言信息的文件。所以字符串偏移量 0 开始了语言代码 1 的值,偏移量 256 开始了语言代码 2 的值,...
不过,我并不完全理解文件的编码。作者说该文件是用 Unicode 编码的,通过在 Notepad++ 中打开它来确认它,将其标识为 UCS2 LE w/o BOM。
我正在尝试在将文本拆分为 255 字节长的块之前对其进行转换,如下所示:
这会产生像“ Пользователь заблокирован
”这样的值。我知道这个文件是俄语的,所以这看起来很有希望。但是,仍有一些值看起来不正确:
使用此代码转换它会产生相同的结果:
这是我从不同来源获得的不同编码:
这是文件的一部分(通过 提取vi
,为清楚起见添加了换行符):
我应该如何读取此文件并使用 PHP 将其转换为正确的编码?现在是哪种编码?提前致谢!
python - 如何在 Odoo 8 中包含 Python 包时解决此错误“未定义符号:PyUnicodeUCS4_FromObject”?
我下载了pyodbc python 包并尝试将其用于Odoo 8,但出现以下错误:
未定义符号:PyUnicodeUCS4_FromObject
系统 python支持UCS4,但 Odoo python支持UCS2,任何对此有任何想法的人都会非常有帮助。谢谢 !!!