问题标签 [codepoint]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
72185 浏览

python - 使用 Python 获取字符的 unicode 代码点

在 Python API 中,有没有办法提取单个字符的 unicode 代码点?

编辑:如果重要的话,我使用的是 Python 2.7。

0 投票
1 回答
2006 浏览

python - 如何在 python 中的代码点上拆分 unicode 字符串?(例如 \u00B7 或 \u2022)?

我尝试了所有我能想到的...

没有任何效果

问题是我想拆分特殊字符。

请帮忙。

提前致谢。

0 投票
0 回答
86 浏览

php - 如何在 PHP 中将 utf8 字符串转换为 unicode 代码点?

可能重复:
UTF-8 到 Unicode 代码点

UTF-8 字符串将被转换为 Unicode 代码点。如何将 utf8 字符串转换为其对应的 unicode 代码点?

0 投票
2 回答
3187 浏览

c++ - 如何让 QChar.unicode() 报告组合字符的 utf-16 表示?

我正在尝试为Code page 437编写编解码器。我的计划是只传递 ASCII 字符并将剩余的 128 个字符映射到一个表中,使用 utf-16 值作为键。

对于某些组合字符(带点的字母、波浪线等),该字符似乎占据了两个 QChar。

打印程序参数的 utf-16 值的测试程序:

一些输出:

我曾预料到

尝试了 QString 中可用的各种规范化形式,但没有人的字节数比默认值少。

由于 QChar 是 2 个字节,它应该能够将上述字符的值保存在一个对象中。为什么 QString 使用两个 QChar?如何获取组合的 unicode 值?

0 投票
3 回答
276 浏览

python - 如何在python中轻松地在unicode中编码一长串十六进制值

我有一个长字符串的十六进制代码点值。对于一个简短的,以下是好的。

但是,由于 unichr 的备用 api unicode() 确实存在,我认为必须有一种方法可以将整个代码点字符串传递给它。到目前为止,我无法做到。

现在我必须像上面的 3 一样输入一个 150 个十六进制值(代码点)的字符串来生成一个完整的字符串。我希望得到类似的东西

我必须使用 'msg' 后者。打印它只是一个例子。有任何想法吗?

0 投票
2 回答
776 浏览

python - How to save Unicode codepoint as character, not codepoint in Python

Is there a way to save a Unicode string into JSON that allows for Unicode codepoints to be replaced with their actual characters?

For instance, having a dict like this ported into JSON...:

...instead of having it dumped with the codepoint, could the key be dumped as the actual string?:

Printing works fine for representing the characters, but saving I'm just lost on. Thanks.

0 投票
4 回答
21807 浏览

java - String.codePointAt 到底是做什么的?

最近我在Java中遇到了String的codePointAt方法。我还发现了其他一些codePoint方法:codePointBeforecodePointCount。它们肯定与 Unicode 有关,但我不明白。

现在我想知道何时以及如何使用codePointAt类似的方法。

0 投票
2 回答
541 浏览

java - 如何建立编码字符的代码点?

给定一个字节流(表示字符)和流的编码,我将如何获得字符的代码点?

上面代码片段中的 read() 返回了什么?它是unicode代码点吗?

0 投票
1 回答
7212 浏览

mysql - Mysql 将 unicode 代码点转换为 utf-8 字符

我正在使用 CHAR(code_point USING ucs2) 将 unicode 代码点转换为 utf-8 字符,但它在 0x00ff 代码点之上给了我意想不到的结果。它为我提供了针对代码点 0x0100 到 0x01FF 的字符 Ā(代码点 0x0100),以及针对代码点 0x0200 到 0x02FF 的字符 Ȁ(代码点 0x0200),依此类推。

所以如果我执行这个查询:

,它给了我结果:

| Ā | Ā |  |  |

而预期的结果是:

| Ā | 一个 |  | γ |

请帮助我理解问题,或提出另一种方法。

提前致谢..

0 投票
1 回答
1031 浏览

c - 在 C 中将代码点转换为 wchar_t

如果我知道 str 中这 2 个汉字你好的 unicode 代码点

如何将此 char * str 代码点转换为汉字并将其分配给 wchar_t * wstr ?

我知道我可以像这样直接分配并解决问题。

但是我的问题比这更复杂,我的情况不允许这样做。

如何进行从文字代码点到 wchar_t * 的转换?

谢谢。

我正在使用将字符集设置为 MBCS 的 MS Visual C,假设我不能使用 UNICODE 字符集。

更新:抱歉,刚刚将wchar_t wstr更正为wchar_t * wstr

UPDATE char * str 包含 UTF-8 代码单元序列,用于 2 个汉字你好

为什么 MessageBox 打印出日文字符?而不是中文?正确的语言环境名称是什么?