问题标签 [double-byte]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1516 浏览

javascript - 用日文字符模拟 ie8 中 textarea 的 maxlength-

我正在尝试在较低版本的 Internet Explorer(ie8、ie7)中为 textarea 模拟 maxlength 的 HTML5 行为:

问题行为是,如果我输入 201 个日文字符,textarea 将按预期将文本调整为仅显示前 200 个字符,但是当我单击它时 textarea 失去焦点时,textarea 将只显示第 201 个日文字符。如果您输入第 201 个字符作为英文字符,则不会发生此问题。我正在使用 Windows 日文 IME 输入日文字符,以防相关细节。

ETA:我认为现在这是 Javascript 与日文 IME 不兼容的问题,但我仍然不知道如何修复它。

0 投票
0 回答
236 浏览

sql - 带有双字节字符的批处理脚本输出文件

我是脚本新手,我似乎无法找到答案。我编写了一个简单的批处理脚本来运行 sql 查询并将输出保存为 .txt 文件。但是,结果包含双字节字符(用于日语数据),这些字符在输出中被转换为问号。

这是脚本中的这一行 - 我希望有一个简单的答案(即在这一行的末尾添加一些格式化代码)?

提前致谢

0 投票
1 回答
185 浏览

r - 由于R中语言特定的特殊字符,如何更正字符串中的额外字符?

我有两个几乎等效的字符串。它们看起来一样。

但是当我尝试nchar()它们时,它们分别返回 26 和 23 个字符。当我使用strsplit();

每个语言特定的特殊字符都算作两个字符。如何将str1变成str2?我唯一的手动解决方案是使用gsub().

附言。不幸的是,我不能把这个例子完整地带到这里。当您尝试复制粘贴代码时,它将都是 23 个字符。这里有复制粘贴的东西。

0 投票
2 回答
543 浏览

unicode - 真正的双字节编码

存在一些真正的双字节编码(DBCS)吗?

  • 除了 UCS-2,当然还有 UTF-16。
  • 我的意思是编码,它也将 ASCII 保存为 2 个字节。
  • 我的意思是空字节。(00 20 - 空格)
  • 请告诉它是否已使用,是否在标准/使用中已过时。

4字节编码的相同问题是否存在(不是UCS-4,UTF-32)?

谢谢。

0 投票
1 回答
773 浏览

c++ - 将双字节字符串路径加载到 TinyXML2

我正在使用 TinyXML2 从磁盘加载 xml 文档。

文件 (configFileName) 的路径是wstring,我将其转换为字符串,如下所示:

这可行,但有时我的程序在双字节操作系统(如中文或韩文)上运行,并且上面从 wstring 到 string 的转换会丢失字符。

如何加载如下路径:

编辑

我尝试了以下方法来转换字符串,但它仍然会破坏中文字符:

0 投票
1 回答
955 浏览

mysql - #1271 - 操作“=”的排序规则的非法混合

使用日期字段选择时出现此错误。日期字段类型为“日期”,搜索值为双字节。搜索条件为birth_day='19940403'。我们怎样才能避免mysql错误。

0 投票
3 回答
1227 浏览

c# - 如何从双字节字符集中打印字符

看看如何从可打印的单字节字符集中输出所有字符。输出文件将包含日文字符,例如チホヤツセ。

这是我尝试使用双字节字符集执行此操作。

问题是输出文件仍然只包含前 255 个字符。每个字节都被单独评估,并分别为该字节返回字符。输出字符串总是包含两个字符而不是一个。由于字符集中的字符用两个字节表示,你必须用两个字节来指定它们,对吧?

那么如何遍历并打印双字节字符集中的所有字符呢?

0 投票
1 回答
10250 浏览

c# - 如何在 C# 中比较和转换表情符号字符

我试图弄清楚如何检查字符串是否包含特定的表情符号。例如,看下面两个表情符号:

骑自行车的人:http: //unicode.org/emoji/charts/full-emoji-list.html#1f6b4

美国国旗:http ://unicode.org/emoji/charts/full-emoji-list.html#1f1fa_1f1f8

骑自行车的人是U+1F6B4,美国国旗是U+1F1FA U+1F1F8

但是,要检查的表情符号是在这样的数组中提供给我的,只有字符串中的数值:

如何将这些数组值转换为实际的 unicode 字符并检查字符串是否包含它们?

我可以为自行车手找到一些工作,但对于美国国旗,我很难过。

对于自行车手,我正在执行以下操作:

但这不适用于美国国旗,因为有多个代码点。

0 投票
2 回答
4817 浏览

c++ - C++ ShiftJIS 到 UTF8 的转换

我需要转换双字节字符。在我的特殊情况下,Shift-Jis 可以更好地处理,最好使用标准 C++。

以下问题最终没有解决方法: MSVC (std::codecvt) 上的双字节编码:无法识别前导字节

那么是否有人对如何使用 C++ 标准处理这种转换提出建议或参考?

0 投票
1 回答
270 浏览

web-services - PEGA 轴错误:解析器已访问

我们有一个 PEGA 前端,我们从那里键入像日语这样的双字节字符,并通过轴发送到分布式 Java Web 服务。当我们发送单字节字符时,这工作正常。仅在使用双字节字符时失败。使用的编码是正在传递的 xml 中的 UTF-8。双字节字符在 PEGA 前端正确呈现。甚至 PEGA 日志也显示完整的字符。

轴版本:2

PEGA 在调用 web 服务时得到响应...

错误:访问解析器时出现问题。解析器已访问!

做了各种组合测试,发现如下...

单字节工作中文工作

日语平假名 - 工作片假名 - 工作汉字 - 不工作

对于汉字,PEGA 甚至没有命中分布式代码,它失败并出现解析器错误“问题访问解析器。解析器已访问!

任何指针都会有所帮助...