问题标签 [utf-16]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1735 浏览

php - 使用 PHP 的 SoapClient 将 UTF-16 字符发送到 WCF 服务

我的 PHP 应用程序正在接受用户输入并将其发送到 WCF Web 服务。有时我的用户从 Word 复制和粘贴,然后将 UTF-16 字符放入他们的消息中,例如“En Dash”\u2013

发生这种情况时,我收到以下错误。

PHP 致命错误:SOAP-ERROR: Encoding: string '\xe2...' is not a valid utf-8 string in *** on line 31

我尝试将 SoapClient 构造函数的编码选项设置为“UTF-16”。我的请求似乎有效,但我注意到 xml 标头上的编码仍设置为 UTF-8。

有任何想法吗?

0 投票
4 回答
4046 浏览

iphone - 将 plist utf-8 值读取为 utf-16

我正在开发一个需要显示上标和下标的 iphone 应用程序。我正在使用选择器从 plist 中读取数据,但 unicode 值没有在选择器视图中正确显示。无法识别下标和上标。我假设这是由于 plist 编码为 utf-8,所以问题是如何将 plist 字符串编码从 utf-8 转换为 utf-16 ?

稍微详细一点:

如果我这样做,它至少在文本字段中正确显示:

NSString *等式 = @"x\u00B2 + y\u00B2 = z\u00B2"

但是,如果我在 plist 中定义相同的字符串并尝试将其读入并将其分配给字符串并将其显示在pickerview 上,它只会显示编码而不是上标。

@Matt:感谢您的建议,Unicode 被转义为 \u00B2 => \u00B2。谷歌搜索“plists 中的转义值”没有返回有用的结果,而且我无法使用键盘 cmd-ctrl-shift-+ 工作。任何进一步的建议将不胜感激!!

0 投票
6 回答
4049 浏览

html - 将 HTML 编码从 UTF-8 切换到 UTF-16 会出现什么问题?

从 UTF-8 更改为 UTF-16 对 HTML 编码有何影响?我想知道你对这个问题的看法。在做出这样的改变之前,我需要考虑一些事情吗?

注意:由于我需要处理大量的日文和中文文本而感兴趣。

0 投票
5 回答
38266 浏览

java - 如何使用 BOM 编码/解码 UTF-16LE 字节数组?

我需要将 UTF-16 字节数组编码/解码到java.lang.String. 字节数组是通过Byte Order Marker (BOM)提供给我的,我需要使用 BOM 对字节数组进行编码。

此外,因为我正在处理 Microsoft 客户端/服务器,所以我想以小端序(连同 LE BOM)发出编码以避免任何误解。我确实意识到使用 BOM 应该可以使用大端,但我不想在 Windows 世界中逆流而上。

例如,这里有一个用 BOM 将 a 编码java.lang.StringUTF-16little endian 的方法:

在 Java 中执行此操作的最佳方法是什么?理想情况下,我想避免将整个字节数组复制到一个新的字节数组中,该数组在开始时分配了两个额外的字节。

java.lang.String解码这样的字符串也是如此,但使用构造函数更简单:

0 投票
4 回答
17029 浏览

c++ - 读取 Unicode 文件 C++

我有一个简单的问题要问。我有一个以 FFFE 开头的 UTF 16 文本文件可供阅读。处理这种文件的 C++ 工具有哪些?我只想阅读它,过滤一些行并显示结果。

它看起来很简单,但我只是有处理普通 ascci 文件的经验,而且我很着急。我正在使用 VS C++,但我不想使用托管 C++。

问候

这里放一个非常简单的例子

0 投票
2 回答
3376 浏览

xml - XML 声明标签是否区分大小写?

我有一个可能是一个非常简单、深奥的问题,但我在任何地方都找不到答案,我需要对此非常确定。

我有来自不同供应商的各种 XML 文件。供应商之一为我提供了一个 XML 文件,其中包含日文字符。最初,我在处理 XML 文件时遇到了问题(我使用的是MSXML SDK)。字符会出现错误。我发现如果将以下内容添加到 XML 文件中,一切都会很好。

所以我要求供应商将其添加到他们的文件中。但是他们用小写的编码添加了它:

当我使用这个声明加载这个新文件时,我遇到了与没有这个声明时相同的问题。

我想要弄清楚(肯定)是该编码属性是否区分大小写(或者是其他问题)。他们将“utf-16”与“UTF-16”放在一起重要吗?

更新:在这些发布答案的人的建议下,我设置并执行了测试。一个文件为小写 utf-16,另一个为大写。除此之外,文件是相同的。这没有解决问题,也不是问题。我的结论是 MSXML 不区分大小写,因为在答案中发布的规范指出。

0 投票
3 回答
1588 浏览

python - Python UTF-16 输出和 Windows 行尾的错误?

使用此代码:

测试.py

然后我运行它:

在 Windows 2000 上的 Python 2.6 中,我发现换行符作为字节序列输出,\x0D\x0A\x00这对于 UTF-16 来说当然是错误的。

我错过了什么,还是这是一个错误?

0 投票
1 回答
4543 浏览

php - PHP UTF-16 到 ASCII 转换

考虑以下字符串。它以 UTF-16-LE 编码并保存到 PHP 变量中。我无法让 mbstring 或 iconv 用单引号替换 '。什么是净化它的好方法。

弦乐:卡尔·萨根'的宇宙连接

0 投票
2 回答
7698 浏览

php - 如何在 PHP 中将 UTF-16 十六进制字符串转换为 UTF-8?

我有以下来自 strace 的输出,我想使用 PHP 将其转换为 UTF-8:

我认为上面的字符串是 UTF 16 HEX。

0 投票
3 回答
906 浏览

perl - 如何检查 Perl 中是否存在 UTF-16 文件名?

我有一个以 UTF-16 编码的文本文件。每行包含许多由制表符分隔的列。对于那些关心的人,该文件是从 iTunes 导出的播放列表 TXT。第 27 列包含一个文件名。

我正在使用类似于以下代码的 Linux 中的 Perl 5.8.8 阅读它:

(请注意:我已经缩短了这个代码片段。在我的实际代码中,我做了一些替换,将 iTunes 使用的绝对 Windows 文件名转换为在我的 Linux 机器上有效的文件名)

即使文件存在,(-e) 文件测试也不返回 true。我相信这与 UTF-16 中的字符串有关,但无法弄清楚问题所在。实际文件名仅使用 ASCII 字符。如果我打印 $filename 变量,文件名会正确打印。

Perl 中的文件名可以是 UTF16 吗?任何想法如何让这个代码片段工作?