问题标签 [unicode-literals]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
147 浏览

c - How to properly use `__attribute__((format (printf, x, y)))` for C11 U"unicode literals"?

I'm porting an application from using char* for everything and everywhere to using UCS4 as it's internal Unicode representation. I use C11's U"unicode literals" for defining strings, which expand to arrays of char32_t, which are uint32_t essentially.

Problem is with properly annotating printf-like functions. As "format" is no longer char*, compiler refuses to compile it further, as well it won't be happy with char32_t * instead of char * for %s format, I suppose.

I don't depend on stdlib *printf family at all, so formatting is done purely by mine implementation.

What is correct solution for this, other than just disable this attribute altogether?

0 投票
1 回答
55 浏览

python - 为什么相同 Unicode 字符串文字的 id() 会给出不同的结果?

为什么 Unicode 字符串文字显示不同的 id?我希望与字符串文字相同的行为。

请就此提供一些指示。

0 投票
1 回答
2095 浏览

c++ - VS2013 和 Unicode 文字给出警告

这段代码有什么问题:

完全相同的代码在没有警告的情况下编译并与 GCC 和 Clang 一起使用,但使用 VS2013 我得到:

..对于以字形“y”、“Y”、“”、“Ô”和“ë”开头的行。

0 投票
1 回答
269 浏览

c++ - 在 C 中打印 unicode 文字

我正在为 Raspberry Pi 制作一个显示一些文本的 OpenVG 应用程序,并且我需要支持外来字符(在本例中为波兰语)。我计划准备一个函数,将 unicode 字符映射到某种高级语言中的 C 中的文字,但现在在 C 中打印这些文字时存在问题。

鉴于以下代码:

大多数波兰字符都有 3 位十六进制代码。当我尝试打印“ś”(0x15B)时,它会打印字符“[”(0x5B)。事实证明,我无法打印任何超过 2 位代码的 unicode 字符。

使用的数据类型是原因吗?我考虑过使用 char16_t 和 char32_t 但在系统中找不到头文件。

0 投票
1 回答
863 浏览

powershell - 将 Unicode 文字分配给 PowerShell 哈希表

已经很晚了,我今晚的工作就完成了——有人可以帮我解决这个问题吗?我是否需要做一些额外的工作才能将这些 Unicode 字符串分配为文字?

第一次尝试创建双编码和所需键值对的哈希表:

我的版本:

收到错误:

参考:http ://www.i18nqa.com/debug/utf8-debug.html

0 投票
1 回答
162 浏览

python - unicode文字到变量?

简单的新手问题,

为什么??

0 投票
2 回答
1993 浏览

python - Python 子进程回显一个 unicode 文字

我知道以前有人问过这样的问题。但我没有找到解决方案。

我想使用在我的 python 文件中定义的 unicode 文字和 subprocess 模块。但我没有得到我需要的结果。例如下面的代码

打印出来

如果我将代码更改为

我得到以下

在这个阶段,我只能假设我反复犯了一个简单的错误。但我很难弄清楚它是什么。通过python的子进程调用时,如何让echo打印出以下内容

编辑:

Python的版本是2.7。我在 Windows 8 上运行,但我希望解决方案独立于平台。

0 投票
1 回答
255 浏览

python - input() 和文字 unicode 解析

Usinginput()将反斜杠作为文字反斜杠,因此我无法使用 unicode 解析字符串输入。

我的意思是说:

将字符串粘贴"\uXXXX\uXXXX\uXXXX"input()调用中将被解释为,"\\uXXXX\\uXXXX\\uXXXX"但我希望将其读取\u为单个字符而不是两个单独的字符。

有谁知道如何或如果可能的话?

编辑:我接受上述输入并将其转换为 ascii,如下所示..

根据我标记的答案,正确的解决方案是:

0 投票
1 回答
1366 浏览

haskell - 在 Haskell 字符串中发现的非转义 unicode 文字

小写的 unicodes是 U+0073 ,这个网站说它是\u0073用 C 和 Java 编写的。

给定一个文件:a.txt包含:

让我们用 Java 阅读这个,然后取消转义\,看看我们得到了什么:

输出是:

unescapeJava(s2)方法调用从文件中\\u0073获取 并转义到\u0073,然后打印为“s”。

我们可以在 Haskell 中做同样的事情吗?

让我们使用文本库来使用这两个文件:

在 Haskell中自动翻译 from \u0073to的任何期望都可能被执行此类期望的而不是前缀s混淆:\x\u

那么如何unescapeJava(..)在 apace-common-lang 中采用方法,并在 Haskell 中复制其功能以从\\u0073to 开始\u0073,并将其打印为“s”?

0 投票
1 回答
64 浏览

python - 我可以确保导入我的 Python 代码的用户使用 Unicode 文字吗?

我的代码包括

并且有许多函数接受(并期望)Unicode 字符串作为输入,以便充分发挥作用。

有没有办法确保用户(在脚本、Python 或 IPython 等中)也使用 Unicode 文字,例如

不会导致错误(“ascii”编解码器无法解码字节 0xce ...”),因此

没有必要?