问题标签 [codepoint]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 Python 获取字符的 unicode 代码点
在 Python API 中,有没有办法提取单个字符的 unicode 代码点?
编辑:如果重要的话,我使用的是 Python 2.7。
python - 如何在 python 中的代码点上拆分 unicode 字符串?(例如 \u00B7 或 \u2022)?
我尝试了所有我能想到的...
没有任何效果
问题是我想拆分特殊字符。
请帮忙。
提前致谢。
php - 如何在 PHP 中将 utf8 字符串转换为 unicode 代码点?
可能重复:
UTF-8 到 Unicode 代码点
UTF-8 字符串将被转换为 Unicode 代码点。如何将 utf8 字符串转换为其对应的 unicode 代码点?
c++ - 如何让 QChar.unicode() 报告组合字符的 utf-16 表示?
我正在尝试为Code page 437编写编解码器。我的计划是只传递 ASCII 字符并将剩余的 128 个字符映射到一个表中,使用 utf-16 值作为键。
对于某些组合字符(带点的字母、波浪线等),该字符似乎占据了两个 QChar。
打印程序参数的 utf-16 值的测试程序:
一些输出:
我曾预料到
尝试了 QString 中可用的各种规范化形式,但没有人的字节数比默认值少。
由于 QChar 是 2 个字节,它应该能够将上述字符的值保存在一个对象中。为什么 QString 使用两个 QChar?如何获取组合的 unicode 值?
python - 如何在python中轻松地在unicode中编码一长串十六进制值
我有一个长字符串的十六进制代码点值。对于一个简短的,以下是好的。
但是,由于 unichr 的备用 api unicode() 确实存在,我认为必须有一种方法可以将整个代码点字符串传递给它。到目前为止,我无法做到。
现在我必须像上面的 3 一样输入一个 150 个十六进制值(代码点)的字符串来生成一个完整的字符串。我希望得到类似的东西
我必须使用 'msg' 后者。打印它只是一个例子。有任何想法吗?
python - How to save Unicode codepoint as character, not codepoint in Python
Is there a way to save a Unicode string into JSON that allows for Unicode codepoints to be replaced with their actual characters?
For instance, having a dict like this ported into JSON...:
...instead of having it dumped with the codepoint, could the key be dumped as the actual string?:
Printing works fine for representing the characters, but saving I'm just lost on. Thanks.
java - String.codePointAt 到底是做什么的?
最近我在Java中遇到了String的codePointAt方法。我还发现了其他一些codePoint方法:codePointBefore
等codePointCount
。它们肯定与 Unicode 有关,但我不明白。
现在我想知道何时以及如何使用codePointAt
类似的方法。
java - 如何建立编码字符的代码点?
给定一个字节流(表示字符)和流的编码,我将如何获得字符的代码点?
上面代码片段中的 read() 返回了什么?它是unicode代码点吗?
mysql - Mysql 将 unicode 代码点转换为 utf-8 字符
我正在使用 CHAR(code_point USING ucs2) 将 unicode 代码点转换为 utf-8 字符,但它在 0x00ff 代码点之上给了我意想不到的结果。它为我提供了针对代码点 0x0100 到 0x01FF 的字符 Ā(代码点 0x0100),以及针对代码点 0x0200 到 0x02FF 的字符 Ȁ(代码点 0x0200),依此类推。
所以如果我执行这个查询:
,它给了我结果:
| Ā | Ā | | |
而预期的结果是:
| Ā | 一个 | | γ |
请帮助我理解问题,或提出另一种方法。
提前致谢..
c - 在 C 中将代码点转换为 wchar_t
如果我知道 str 中这 2 个汉字你好的 unicode 代码点
如何将此 char * str 代码点转换为汉字并将其分配给 wchar_t * wstr ?
我知道我可以像这样直接分配并解决问题。
但是我的问题比这更复杂,我的情况不允许这样做。
如何进行从文字代码点到 wchar_t * 的转换?
谢谢。
我正在使用将字符集设置为 MBCS 的 MS Visual C,假设我不能使用 UNICODE 字符集。
更新:抱歉,刚刚将wchar_t wstr更正为wchar_t * wstr
UPDATE char * str 包含 UTF-8 代码单元序列,用于 2 个汉字你好
为什么 MessageBox 打印出日文字符?而不是中文?正确的语言环境名称是什么?