问题标签 [astral-plane]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1185 浏览

c# - 4字节字符如何在C#中表示

在 C# 中如何表示 4 个字节的字符?像一个字符或一组 2 个字符?

0 投票
2 回答
688 浏览

unicode - 如何输入非 BMP unicode(超过 4 个字符的十六进制)作为 Mathematica 的输入

问题描述: Mathematica "\:nnnn" 用作 unicode 输入的语法。例如,如果我们输入 "\:6c34",我们会得到"水"(中文中的“水”)。但是,如果有人想进入"\:1f618"(面对亲吻)怎么办。当我尝试这个时,我得到了"ὡ8",不是"a face throwing a kiss"。因此,Mathematica"\:1f61"在我输入之前进行了评估"8"

问题: 我们怎样才能延迟这个评估,或者我们怎样才能输入任何一般的 unicode 输入(对于超过 4 个字符的十六进制)?

软件和硬件平台: 我在 Intel Mac 上运行 Mathematica 8。我尝试了 Mathematica 和 Mathematica notebook 的命令行版本,它们的行为相同。

谢谢你。


思考: Unicode 是一个可扩展的标准,它可以增长(而且它确实会增长:))。实施本标准的软件系统可能只实施本标准的一个子集,以便有效和有用(8 位、16 位或 32 位编码)。一、作为某个软件包的用户,不应该假设一旦软件说它支持unicode,它就支持unicode的通用集。

0 投票
4 回答
4315 浏览

c# - 关于字符类,哪个 .NET 平台和哪个版本的 Windows 支持哪个版本的 Unicode?

更新的问题¹

关于字符类、比较、排序、规范化和排序规则,哪些 .NET 平台支持哪些 Unicode 版本?

原始问题

我记得有些模糊地读过 .NET 支持 Unicode 3.0 版,并且内部 UTF-16 编码并不是真正的 UTF-16,但实际上使用的是 UCS-2,这是不一样的。例如,似乎 U+FFFF 以上的字符是不可能的,即考虑:

它存储字符串"ᵽ9"

我基本上是在寻找以下答案的明确参考:

  • 如果在 .NET 中不是真正的 UTF-16,它是什么?
  • .NET 支持哪个版本的 Unicode?
  • 如果在不久的将来不支持或计划不支持最新版本,是否有人知道(非)商业库或我如何解决此问题?

¹)我随着时间的推移更新了这个问题,对于答案和更大的社区来说似乎更合适。我留下了原始问题,以代替评论中已回答的部分。旧的 UCS-2(无代理)也用于现在古老的 32 位 Windows 版本,.NET 在内部一直使用 UTF-16(有代理)。

0 投票
4 回答
2968 浏览

windows - 在 Windows 中,如何输入 Unicode 基本多语言平面之外的字符?

我知道 Windows 自 Windows XP 以来就支持补充平面。

我有字体,我知道这些字体在基本多语言平面 (BMP) 之外有字符。

对于这些字符,Unicode 代码点由五个十六进制数字组成。

我不知道如何在应用程序中输入这些字符。

Windows 似乎只支持 BMP 中字符的键盘输入。您可以输入十进制数,或者某些应用程序允许您输入四位十六进制数。

有人可以确认如何管理条目吗?我不在乎它是直接来自键盘还是应用程序辅助。(默认的 Windows“字符映射”应用程序只支持 BMP 中的字符,所以我需要建议——最好是支持至少 Unicode 版本 5 的应用程序,如果不是 6 的话。)

在 Java 中,这些字符使用 UTF-16 中的“代理对”进行管理。我担心 Windows 也可能有一些旧的“Unicode 是 16 位”遗留问题,导致出现类似问题。即使确认我需要输入代理对号也是一个答案。

谢谢!

0 投票
4 回答
5906 浏览

java - java中的字符到Unicode比U + FFFF多?

如何在 Java 中使用 char 在 U+FFFF 上方显示 Unicode 字符?

我需要这样的东西(如果它是有效的):

0 投票
2 回答
1654 浏览

ios - 在 iOS 上显示基于 Unicode 的五位埃及象形文字字体的代码是什么?

StackOverflow 和其他网站上的代码建议在 iOS上显示 unicode :

这适用于大多数 unicode 字符,但是,对于埃及象形文字 unicode 字体(等待加载大字体)失败。

象形文字 unicode 有一个额外的数字(即“\uF3001”而不是“\uF300”)。结果,显示了错误的字符,并且“1”留在了尾随。

很明显iOS可以显示象形文字字体。例如,如果将此字形 () 剪切并粘贴到 setText 语句中,则在导入 TTF 后,可以在 iOS 屏幕上看到该字形。

所以问题是,如何使用需要五位而不是四位的 unicode 字体在 setText 语句中显示 unicode 字符(即“\uF3001”)?

0 投票
3 回答
3815 浏览

python - 向 mysql 插入 4 字节 unicode 引发的警告

请看以下内容:

string '\xF0\x9F\x91\x8A,实际上是一个 4 字节的 unicode: u'\U0001f62a'。mysql 的字符集是 utf-8,但插入 4 字节 unicode 会截断插入的字符串。我google了一下这样的问题,发现5.5.3下的mysql不支持4字节unicode,可惜我的是5.5.224。我不想升级mysql服务器,所以我只想在python中过滤4字节的unicode,我尝试使用正则表达式但失败了。那么,有什么帮助吗?

0 投票
1 回答
15305 浏览

mongodb - MongoDB 可以使用基本多语言平面之外的代码点存储和操作 UTF-8 字符串吗?

在 MongoDB 2.0.6 中,当尝试存储包含字符串字段的文档或查询文档时,其中字符串的值包含 BMP 之外的字符,我收到大量错误,例如:“不正确的 UTF-16:55357”,或“缓冲区太小”

有哪些设置、更改或建议允许在 Mongo 中存储和查询多语言字符串,尤其是包含 0xFFFF 以上这些字符的字符串?

谢谢。

0 投票
3 回答
1268 浏览

javascript - 如何将角色转出基本多语言平面?

对于 Basic Multilingual Plane 中的字符,我们可以使用 '\uxxxx' 转义它。例如,您可以使用 /[\u4e00-\u9fff]/ 来匹配一个常见的汉字(0x4e00-0x9fff 是 CJK 统一表意文字的范围)。

但是对于基本多语言平面之外的字符,它们的代码大于 0xffff。所以你不能使用格式'\uxxxx'来转义它,因为'\u20000'表示字符'\u2000'和字符'0',而不是代码为0x20000的字符。

如何将字符转义出基本多语言平面?直接使用这些字符不是一个好主意,因为它们无法在大多数字体中显示。

0 投票
1 回答
191 浏览

javascript - Rails Asset Pipeline Minify 更改 4 字节 Unicode 字符

我正在使用http://code.kwint.in/emoji/将 unicode iOS 表情符号字符转换为我的 Rails 应用程序中的图像。

它在开发中运行良好,但是在为生产预编译资产时,unicode 字符代码会发生变化。

例如,它们从"😄"""

我怎样才能防止这种变化发生,因为它破坏了我上面链接的 emoji.js 脚本?