问题标签 [codepoint]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

109 问题

0 投票

2 回答

431 浏览

string - 如何将代码点数组（Int32）转换为字符串？

在 Crystal 中，可以将 String 转换为代码点的 Array(Int32)：

有没有办法将数组变回字符串？

string crystal-lang codepoint

2017-09-19T00:03:15.213

0 投票

1 回答

13 浏览

codepoint - 按他们的代码点从低到高排列标题？

我希望根据他们的代码点从低到高排列我的标题。以下是我的尝试，我想知道是否有人可以就我是否正确地完成此操作提供建议。我基本上查阅了 ASCII 图表（ASCII 图表）来手动执行此操作。

codepoint

2018-01-25T11:40:49.467

0 投票

0 回答

13 浏览

unicode - HTML 标记的来源和名称与小于大于字符中的 unicode 数字相同

我有时会看到 unicode 数字看起来像

他们来自哪里，这个代表的正式名称是什么？

unicode codepoint

2018-02-26T22:35:02.840

0 投票

3 回答

1118 浏览

string - 在 Erlang 中将字符串转换为字符的最惯用方法是什么？

将其转换为最惯用的方法是什么："helloworld"在["h","e","l","l","o","w","o","r","l","d"]Erlang 中？

string erlang codepoint

2018-03-13T05:44:43.183

0 投票

1 回答

206 浏览

go - 检查是否分配了 Unicode 代码点

Go 有unicode包，其中包含有用的函数，例如IsGraphicor IsPrint。但缺少的一个功能是IsAssigned. 当然，我可以使用其他函数编写自己的函数。但我宁愿期望标准库提供这个功能。在 Java 中，编写这个函数很容易：

在 Go 中没有函数unicode.Type(rune)或unicode.IsAssigned(rune). 我能找到的最接近的是：

但是该代码认为 U+00AD （软连字符）未分配，这是错误的。

如何获得有关未分配代码点的正确信息？

go unicode codepoint

2018-04-10T21:27:45.883

0 投票

1 回答

174 浏览

optimization - 用于 unicode 代码点的高效查找表

想知道如何完成 unicode 代码点查找表。也就是说，给定一个字符，例如a, return U+24B6，反之亦然。想知道是否有任何有效的技巧，使其不仅仅归结为：

这会占用大量文件大小（和内存）。也许有一种紧凑的方法可以在文件中表示它（不确定这是否是这样做的），然后在运行时将其扩展到更大的内存。

或者也许有一种方法可以在运行时保持最小化，所以它是动态计算的。

optimization data-structures unicode encoding codepoint

2018-06-21T05:46:27.460

0 投票

1 回答

454 浏览

java - 如何判断 Unicode 代码点是否是一个完整的可打印字形（或字形簇）？

假设有一个 UnicodeString对象，我想一个一个地打印其中String的每个 Unicode 字符。在我使用非常有限的语言进行的简单测试中，只要假设一个代码点始终与一个字形相同，我就可以连续实现这一点。

但我知道事实并非如此，上面的代码逻辑在某些国家或语言中很容易导致意想不到的结果。

所以我的问题是，有没有办法判断一个 Unicode 代码点是 Java 还是 C# 中的一个完整的可打印字形？如果我必须用 C/C++ 编写代码，那也没关系。

我用谷歌搜索了几个小时，但我得到的只是代码单元和代码点。很容易判断代码单元是否是代理对的一部分，但与字素无关。

有人能指出我正确的方向吗？

java c#unicode glyph codepoint

2018-08-23T22:06:31.947

0 投票

1 回答

4515 浏览

unicode - 为什么 Unicode 被限制为 0x10FFFF？

为什么最大 Unicode 代码点限制为 0x10FFFF？是否可以通过 UTF-16、UTF-8 等任何编码方案在此代码点上方表示 Unicode - 例如 0x10FFFF + 0x000001 = 0x110000？

unicode character-encoding range codepoint

2018-09-06T11:43:54.267

0 投票

0 回答

266 浏览

javascript - 如何将 unicode 表情符号转换为十六进制代码点（具有多个组）

我正在构建一个应用程序来转换表情符号短名称（如：flag_cf:）并通过一系列操作将它们转换为十六进制代码点（这是地图中返回 Twitter 表情符号/twemoji 的键）。

我有一个实用程序（emojione.shortnameToUnicode()）将短名称转换为本机 unicode 表情符号，但我在将本机 unicode 表情符号转换为十六进制代码点时遇到了麻烦。

我一直在使用：

当生成的十六进制代码点是单个数字时，这可以正常工作。但是，表情符号之类的标志似乎有两个，例如:flag_cn:is 1f1f9-1f1f7。但是，我上面的过程只会返回第一个十六进制代码点（即1f1f9）。

javascript emoji codepoint twemoji

2018-09-30T08:00:51.113

0 投票

1 回答

381 浏览

unicode - kotlin 使用代码点将 utf 字符串拆分为单个长度的子字符串

我刚刚开始使用 kotlin，所以我确信有一种简单的方法可以做到这一点，但我没有看到。我想使用代码点将 a 拆分为单长度子字符串。在 Java 8 中，这有效：

输出是：

我将如何在 kotlin 中做到这一点？我可以到达代码点，尽管它很笨拙，而且我确信我做错了。但我无法从代码点返回字符串。整个字符串/字符界面对我来说似乎不同，我只是不明白。

谢谢史蒂夫·S。

unicode kotlin codepoint

2018-12-16T03:12:38.900

1 2 3 4 5 6 7 8 9 10