问题标签 [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
14707 浏览

regex - 这些 Unicode 字符(代码点)在这个正则表达式中是什么意思?

我有以下正则表达式:我想出了大部分如下:

在理解验证表达式的最后部分时需要帮助:

任何人都知道这是什么意思?

0 投票
4 回答
20241 浏览

unicode - 为什么用'U+'来指定一个Unicode码位?

0 投票
4 回答
28507 浏览

c# - 如何将 unicode 字符串输出到 RTF(使用 C#)

我正在尝试将 unicode 字符串输出为 RTF 格式。(使用 c# 和 winforms)

来自维基百科

如果需要 Unicode 转义,则使用控制字 \u,后跟一个 16 位有符号十进制整数,给出 Unicode 代码点编号。对于不支持 Unicode 的程序,它后面必须跟在指定代码页中该字符的最近表示。例如,\u1576? 将给出阿拉伯字母 beh,指定不支持 Unicode 的旧程序应将其呈现为问号。

我不知道如何将 Unicode 字符转换为 Unicode 代码点(“\u1576”)。转换为 UTF 8、UTF 16 和类似格式很容易,但我不知道如何转换为代码点。

我使用这个的场景:

  • 我将现有的 RTF 文件读入字符串(我正在阅读模板)
  • string.replace #TOKEN# with MyUnicodeString(模板填充数据)
  • 将结果写入另一个 RTF 文件。

问题,当 Unicode 字符到达时出现

0 投票
2 回答
230 浏览

validation - 如何在输入验证中允许 UNICODE 代码点的子集?

我正在创建一项可以“走向国际”到非英语市场的服务。我不想将用户名限制为 ASCII 字符范围,但希望允许用户指定他们的“自然”用户名。好的,使用 UNICODE(并说 UTF-8 作为我的用户名文本编码)。

但!我不希望用户创建包含“符号”代码点的“非名称”用户名。例如,我不想允许像 √√√√√√øøøøø 这样的用户名。

是否有我可以检查(可能使用正则表达式)以接受/拒绝给定用户名的 UNICODE 的“符号”代码点列表?

谢谢!

0 投票
5 回答
2099 浏览

unicode - 为什么Unicode中有重复的字符?

我可以在Unicode中看到一些重复的字符。例如,字符“C”可以由代码点 U+0043 和 U+0421 表示。为什么会这样?

0 投票
4 回答
2520 浏览

c++ - 如何使用 c++ 或调用 winapi 查找字符是否属于特定代码页

我们如何确定一个字符是否属于特定的代码页?或者我们如何确定一个字符是否适合应用程序的当前活动 IME。

0 投票
1 回答
1900 浏览

unicode - Haskell:将unicode整数转换为实际的unicode字符

假设我的 Haskell 函数有一个输入,它应该是一个 unicode 代码点的编号。如何将其转换为相应的字符?

例子:

123 到“{”。

0 投票
4 回答
4513 浏览

perl - 如何将 Unicode 代码点 (\uXXXX) 转换为 Perl 中的字符?

我有一些 unicode 代码点(\u5315\u4e03\u58ec\u4e8c\u4e0a\u53b6\u4e4b),我必须将它们转换成它们代表的实际字符。

最简单的方法是什么?

0 投票
3 回答
973 浏览

python - 如何使用 Python 将 unicode 字符串中的重音字符转换为其 unicode 字符代码?

只是想知道如何将 unicode 字符串转换u'é'为其 unicode 字符代码u'\xe9'

0 投票
4 回答
3769 浏览

perl - 在 Perl 中将 UTF8 字符串转换为数值

例如,

我想打印出数值