问题标签 [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
431 浏览

string - 如何将代码点数组(Int32)转换为字符串?

在 Crystal 中,可以将 String 转换为代码点的 Array(Int32):

有没有办法将数组变回字符串?

0 投票
1 回答
13 浏览

codepoint - 按他们的代码点从低到高排列标题?

我希望根据他们的代码点从低到高排列我的标题。以下是我的尝试,我想知道是否有人可以就我是否正确地完成此操作提供建议。我基本上查阅了 ASCII 图表(ASCII 图表)来手动执行此操作。

0 投票
0 回答
13 浏览

unicode - HTML 标记的来源和名称与小于大于字符中的 unicode 数字相同

我有时会看到 unicode 数字看起来像

他们来自哪里,这个代表的正式名称是什么?

0 投票
3 回答
1118 浏览

string - 在 Erlang 中将字符串转换为字符的最惯用方法是什么?

将其转换为最惯用的方法是什么:"helloworld"["h","e","l","l","o","w","o","r","l","d"]Erlang 中?

0 投票
1 回答
206 浏览

go - 检查是否分配了 Unicode 代码点

Go 有unicode包,其中包含有用的函数,例如IsGraphicor IsPrint。但缺少的一个功能是IsAssigned. 当然,我可以使用其他函数编写自己的函数。但我宁愿期望标准库提供这个功能。在 Java 中,编写这个函数很容易:

在 Go 中没有函数unicode.Type(rune)unicode.IsAssigned(rune). 我能找到的最接近的是:

但是该代码认为 U+00AD (软连字符)未分配,这是错误的。

如何获得有关未分配代码点的正确信息?

0 投票
1 回答
174 浏览

optimization - 用于 unicode 代码点的高效查找表

想知道如何完成 unicode 代码点查找表。也就是说,给定一个字符,例如a, return U+24B6,反之亦然。想知道是否有任何有效的技巧,使其不仅仅归结为:

这会占用大量文件大小(和内存)。也许有一种紧凑的方法可以在文件中表示它(不确定是否是这样做的),然后在运行时将其扩展到更大的内存。

或者也许有一种方法可以在运行时保持最小化,所以它是动态计算的。

0 投票
1 回答
454 浏览

java - 如何判断 Unicode 代码点是否是一个完整的可打印字形(或字形簇)?

假设有一个 UnicodeString对象,我想一个一个地打印其中String的每个 Unicode 字符。在我使用非常有限的语言进行的简单测试中,只要假设一个代码点始终与一个字形相同,我就可以连续实现这一点。

但我知道事实并非如此,上面的代码逻辑在某些国家或语言中很容易导致意想不到的结果。

所以我的问题是,有没有办法判断一个 Unicode 代码点是 Java 还是 C# 中的一个完整的可打印字形?如果我必须用 C/C++ 编写代码,那也没关系。

我用谷歌搜索了几个小时,但我得到的只是代码单元和代码点。很容易判断代码单元是否是代理对的一部分,但与字素无关。

有人能指出我正确的方向吗?

0 投票
1 回答
4515 浏览

unicode - 为什么 Unicode 被限制为 0x10FFFF?

为什么最大 Unicode 代码点限制为 0x10FFFF?是否可以通过 UTF-16、UTF-8 等任何编码方案在此代码点上方表示 Unicode - 例如 0x10FFFF + 0x000001 = 0x110000?

0 投票
0 回答
266 浏览

javascript - 如何将 unicode 表情符号转换为十六进制代码点(具有多个组)

我正在构建一个应用程序来转换表情符号短名称(如:flag_cf:)并通过一系列操作将它们转换为十六进制代码点(这是地图中返回 Twitter 表情符号/tw​​emoji 的键)。

我有一个实用程序(emojione.shortnameToUnicode())将短名称转换为本机 unicode 表情符号,但我在将本机 unicode 表情符号转换为十六进制代码点时遇到了麻烦。

我一直在使用:

当生成的十六进制代码点是单个数字时,这可以正常工作。但是,表情符号之类的标志似乎有两个,例如:flag_cn:is 1f1f9-1f1f7。但是,我上面的过程只会返回第一个十六进制代码点(即1f1f9)。

0 投票
1 回答
381 浏览

unicode - kotlin 使用代码点将 utf 字符串拆分为单个长度的子字符串

我刚刚开始使用 kotlin,所以我确信有一种简单的方法可以做到这一点,但我没有看到。我想使用代码点将 a 拆分为单长度子字符串。在 Java 8 中,这有效:

输出是:

我将如何在 kotlin 中做到这一点?我可以到达代码点,尽管它很笨拙,而且我确信我做错了。但我无法从代码点返回字符串。整个字符串/字符界面对我来说似乎不同,我只是不明白。

谢谢史蒂夫·S。