问题标签 [multibyte]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
6446 浏览

java - 带有中文字符的 URI 无效 (Java)

使用 URL 中的汉字设置 URL 连接时遇到问题。它适用于拉丁字符:

getInputStream() 调用导致:

0 投票
1 回答
293 浏览

compiler-errors - 打包双字节文件名时出错

我正在尝试使用 Inno-Setup 5.4.0 将一些名称包含韩语字符的文件打包到一个安装程序中。当编译器到达它们时,它会提示错误

文件名、目录名或卷语法不正确。

是否有任何标志允许它读取这些文件或一些解决方法以将这些文件包含到安装程序中?

0 投票
1 回答
10743 浏览

javascript - 如何判断字符串是否包含 Javascript 中的多字节字符?

是否可以在 Javascript 中检测字符串是否包含多字节字符?如果是这样,是否可以分辨出哪些?

我遇到的问题是这个(如果 Unicode 字符不适合您,我们深表歉意)


在这里编辑一下(我希望) 据我所知,Javascript中的所有字符串都表示为一系列UTF-16代码点,这意味着常规字符实际上占用了2个字节(16位),所以我在标题中使用“多字节”有点离开。有些字符不属于基本多语言平面 (BMP),例如上面示例中的字符串,因此它们占用两个代码点(32 位)。这就是我要问的问题。我也没有编辑原始标题,因为对于不太了解这些东西的人(因此会搜索有关它的信息),“多字节”是有意义的。

0 投票
1 回答
2140 浏览

.net - 在 .NET 中使用多字节字符限制 URL 编码字符串的长度

我正在使用 .NET,我需要截断一个可能包含多字节字符的字符串,以便它在经过 URL 编码后不会超过设定的长度。这似乎是内置的,但我找不到它。

一旦它被 URL 编码,我只会做一个子字符串,但这可能会占用编码字符的一部分(空格变成 %20,如果它在最后它可能会被截断为 %2,这是无效的),或者多字节字符的一部分将被截断(π 被编码为 %CF%80,它可能被截断为 %、%CF、%CF%8,所有这些都是错误的)。

0 投票
1 回答
806 浏览

java - Multibyte character issue while reading from oracle database

I am reading a column from database using rs.getString() method , the column has some multibyte data.

When retrieved through rs.getString() , the data get garbled and all multibyte characters appear as ??????.

Please suggest what should be done.

I have tried using -Dfile.encoding=UTF8 , but that does not work out.

0 投票
5 回答
4789 浏览

c++ - 测试 char* 字符串是否包含多字节字符

我从 TCP 服务器接收到一个字节流缓冲区,其中可能包含形成 unicode 字符的多字节字符。我想知道是否总是有办法检查 BOM 来检测这些字符,或者你想怎么做?

0 投票
1 回答
1216 浏览

java - 多字节字符损坏为 ???? 从数据库中读取并使用 HTTPURLConnection 发布到 ASP 页时

在我的 java 代码中,我从数据库中检索一些多字节数据并制作一些 xml DOM,将该数据作为某个节点的值,然后将 DOM 转换为 String 并通过 HTTPURLConnection 将字节测试发布到 ASP Page,但在接收端以某种方式结束数据显示为???? 而不是一些多字节值。请建议该怎么做。

我已经在做的事情..

1)我已设置-Dfile.encoding =UTF8为系统属性 2)在TransformerFactory用于将我的 XML DOM 转换为 String 时,我已设置

以确保那里的编码正确。请建议我哪里出错了。

@Jon Skeet 这里要添加的东西很少...... 1)我从数据库中正确获取数据 2)转换后的 XML 似乎也是正确的,因为我通过将其保存到我的本地文件系统进行了检查。
对于之前发布的内容,我使用了类似的东西

并且接收端的结果数据被转换为????? 但后来我切换到
'

那么接收端的数据似乎是正确的......但在这种情况下,问题出现在接收端的处理方式上。在我正在使用的接收器 ASP 代码中objStream.WriteLine (oXMLDom.xml) ......在这里它失败并开始给出内部服务器错误......请建议第二种方法有什么问题。

0 投票
3 回答
3794 浏览

php - 如何使用 PHP 将一些多字节字符转换为其数字 html 实体?

测试字符串:

0 投票
2 回答
5883 浏览

php - 使用密钥对 php5 中的 utf-8 字符串进行简单加密/解密

有人可以就“使用密钥对 php5 中的 utf-8 字符串进行简单加密/解密”这个主题给我建议吗?关于独立图书馆的一些建议?(不依赖于 32/64 位机器)。

0 投票
1 回答
761 浏览

ruby-on-rails - Ruby:如何将多字节字符表示为用于 httparty 消费的百分比转义八位字节

我正在使用 HTTParty 从一些 REST url 获取 json 数据

问题是如果我传递一个包含多字节字符的 get 参数,例如如果我想使用中文 UTF-8 搜索词“电影”:

我收到一个错误

URI::InvalidURIError at / bad URI(is not URI?): link here

在 Stackoverflow 上搜索,我发现以下答案建议将我的 @search_term 格式化为百分比转义的八位字节,但我无法弄清楚如何做到这一点。

我正在寻找一个看起来像这样的解决方案: