问题标签 [codepoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
string - 如何将代码点数组(Int32)转换为字符串?
在 Crystal 中,可以将 String 转换为代码点的 Array(Int32):
有没有办法将数组变回字符串?
codepoint - 按他们的代码点从低到高排列标题?
我希望根据他们的代码点从低到高排列我的标题。以下是我的尝试,我想知道是否有人可以就我是否正确地完成此操作提供建议。我基本上查阅了 ASCII 图表(ASCII 图表)来手动执行此操作。
unicode - HTML 标记的来源和名称与小于大于字符中的 unicode 数字相同
我有时会看到 unicode 数字看起来像
他们来自哪里,这个代表的正式名称是什么?
string - 在 Erlang 中将字符串转换为字符的最惯用方法是什么?
将其转换为最惯用的方法是什么:"helloworld"
在["h","e","l","l","o","w","o","r","l","d"]
Erlang 中?
go - 检查是否分配了 Unicode 代码点
Go 有unicode
包,其中包含有用的函数,例如IsGraphic
or IsPrint
。但缺少的一个功能是IsAssigned
. 当然,我可以使用其他函数编写自己的函数。但我宁愿期望标准库提供这个功能。在 Java 中,编写这个函数很容易:
在 Go 中没有函数unicode.Type(rune)
或unicode.IsAssigned(rune)
. 我能找到的最接近的是:
但是该代码认为 U+00AD (软连字符)未分配,这是错误的。
如何获得有关未分配代码点的正确信息?
optimization - 用于 unicode 代码点的高效查找表
想知道如何完成 unicode 代码点查找表。也就是说,给定一个字符,例如a
, return U+24B6
,反之亦然。想知道是否有任何有效的技巧,使其不仅仅归结为:
这会占用大量文件大小(和内存)。也许有一种紧凑的方法可以在文件中表示它(不确定这是否是这样做的),然后在运行时将其扩展到更大的内存。
或者也许有一种方法可以在运行时保持最小化,所以它是动态计算的。
java - 如何判断 Unicode 代码点是否是一个完整的可打印字形(或字形簇)?
假设有一个 UnicodeString
对象,我想一个一个地打印其中String
的每个 Unicode 字符。在我使用非常有限的语言进行的简单测试中,只要假设一个代码点始终与一个字形相同,我就可以连续实现这一点。
但我知道事实并非如此,上面的代码逻辑在某些国家或语言中很容易导致意想不到的结果。
所以我的问题是,有没有办法判断一个 Unicode 代码点是 Java 还是 C# 中的一个完整的可打印字形?如果我必须用 C/C++ 编写代码,那也没关系。
我用谷歌搜索了几个小时,但我得到的只是代码单元和代码点。很容易判断代码单元是否是代理对的一部分,但与字素无关。
有人能指出我正确的方向吗?
unicode - 为什么 Unicode 被限制为 0x10FFFF?
为什么最大 Unicode 代码点限制为 0x10FFFF?是否可以通过 UTF-16、UTF-8 等任何编码方案在此代码点上方表示 Unicode - 例如 0x10FFFF + 0x000001 = 0x110000?
javascript - 如何将 unicode 表情符号转换为十六进制代码点(具有多个组)
我正在构建一个应用程序来转换表情符号短名称(如:flag_cf:)并通过一系列操作将它们转换为十六进制代码点(这是地图中返回 Twitter 表情符号/twemoji 的键)。
我有一个实用程序(emojione.shortnameToUnicode())将短名称转换为本机 unicode 表情符号,但我在将本机 unicode 表情符号转换为十六进制代码点时遇到了麻烦。
我一直在使用:
当生成的十六进制代码点是单个数字时,这可以正常工作。但是,表情符号之类的标志似乎有两个,例如:flag_cn:
is 1f1f9-1f1f7
。但是,我上面的过程只会返回第一个十六进制代码点(即1f1f9
)。
unicode - kotlin 使用代码点将 utf 字符串拆分为单个长度的子字符串
我刚刚开始使用 kotlin,所以我确信有一种简单的方法可以做到这一点,但我没有看到。我想使用代码点将 a 拆分为单长度子字符串。在 Java 8 中,这有效:
输出是:
我将如何在 kotlin 中做到这一点?我可以到达代码点,尽管它很笨拙,而且我确信我做错了。但我无法从代码点返回字符串。整个字符串/字符界面对我来说似乎不同,我只是不明白。
谢谢史蒂夫·S。