问题标签 [multibyte]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
707 浏览

windows - win32 api - MultiByteToWideChar 和 WideCharToMultiByte 问题

我是否需要释放从这些函数中获得的字符串?或者系统可能会跟踪它们。GetCommandLine() 也有同样的问题。

0 投票
4 回答
2991 浏览

c++ - 如何在我的代码中同时支持 Unicode 和多字节字符集?

我必须说我是 win32 c++ 编程的新手,所以我面临一个问题,即
某些代码在多字节字符集中而不是在 Unicode 字符集中编译。
我的代码如何支持两者?
例如,这 NOT 仅在 Unicode 中编译为多字节,而注释向量仅在多字节中编译:

0 投票
6 回答
32893 浏览

c++ - 获取 std::string 字符串的大小(以字节为单位)

我想获取 astd::string的字符串在内存中占用的字节数,而不是字符数。该字符串包含一个多字节字符串。会std::string::size()为我做这个吗?

编辑:另外,是否size()还包括终止NULL

0 投票
5 回答
1275 浏览

c++ - C++:如何以独立于平台的方式读写多字节整数值?

我正在开发一个简单的协议,用于从缓冲区读取/写入整数值。绝大多数整数都低于 128,但更大的值是可能的,所以我正在寻找某种形式的多字节编码来以简洁的方式存储值。

以独立于平台(即字节顺序不可知)的方式读取/写入多字节值的最简单和最快的方法是什么?

0 投票
3 回答
1003 浏览

ruby-on-rails - 为什么 Rails 3 认为 xE2x80x89 表示 â x80 x89

我有一个从 utf-8 页面抓取的字段:

并保存在 yml 文件中:

(xE2x80x99 是这个撇号的正确 UTF-8 表示

但是,当我将值加载到哈希中并将其生成到标记为 utf-8 的页面时,我得到:

我查找了字符 â,它以 UTF-16 编码为 x00E2,当我粘贴字符串时,字符 x80 和 x89 是不可见的,但在 â 之后出现。我认为这意味着我的应用程序正在输出三个 UTF-16 字符而不是一个 UTF-8。

如何让 Rails 将 3 字节 UTF-8 代码解释为单个字符?

0 投票
6 回答
12123 浏览

php - 为什么在 PHP 中使用多字节字符串函数?

目前,我不明白为什么在处理 UTF-8 时在 PHP 中使用 mbstring 函数真的很重要?strlen我在linux下的locale已经设置为UTF-8了,那么为什么preg_replace默认情况下不能正常工作呢?

0 投票
2 回答
730 浏览

winapi - 如何在 WinAPI 中检测不完整的多字节字符?

我正在使用MultiByteToWideChar将 UTF-8 编码流转换为宽字符。当存在不完整字符和转换缓冲区结束时,此函数将其替换为“?” 符号。我应该实施哪些检查/设置来检测不完整的字符,以便将它们添加到下一个缓冲区?

0 投票
1 回答
5407 浏览

c++ - 我的项目在 vs2008 中编译没有任何问题,但在 2010 年没有?

我有一个 C++ 项目,它在 2008 年编译得很好,而在 2010 年它就无法编译。

在 2010 年,如果我将其更改为多字节字符集,它将编译,但没有字符串正常工作可以准确描述它发生了什么,如果我不更改它,则会出现以下代码错误和警告。

在 2008 年,它编译并运行良好,没有任何问题。

我在 C++ 中不是很聪明,所以如果可能的话,尽可能详细的易于理解的响应将非常有助于我理解正在发生的事情并可能修复它。

以下是它不是多字节时的错误和警告:

C++项目文件:

0 投票
1 回答
202 浏览

multibyte - 网络字节顺序对专有协议是否重要?

所以我有一个通过 UDP 运行的自定义二进制协议。

我的源是一个 little-endian 嵌入式设备,传输基本上是 send(packed struct) 。我的目标设备绝大多数将是小端 PC。

我收到了更改为网络字节顺序的请求。我的第一反应是“没有机会”。我没有看到去翻转我的 100 多个字段中的每一个,混合 2 到 8 个字节的整数,以及浮点数和双精度数,然后让我的大多数用户右转并将它们全部翻转回来,并处理双方的所有小编码错误。

我错过了什么吗?今天网络字节顺序真的很重要吗?它真的很重要吗?指定什么字节顺序显然至关重要,但除此之外,谁真正在乎呢?

0 投票
2 回答
11902 浏览

python - 有没有人能够使用 python 的 xlwt 写出 UTF-8 字符?

我正在尝试将数据写入包含日文字符的 excel 文件。我正在使用 codec.open() 来获取数据,这似乎工作正常,但是当我尝试写入数据时遇到了这个错误:

我不明白为什么程序会坚持在这里使用 ascii。当我创建一个新的工作簿对象时,我使用了

并且程序文件本身和它正在读取的文件都保存为 UTF-8。

有人有什么想法吗?

编辑:这是 xlwt 包的链接。http://pypi.python.org/pypi/xlwt