问题标签 [unicode-literals]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - How to properly use `__attribute__((format (printf, x, y)))` for C11 U"unicode literals"?
I'm porting an application from using char*
for everything and everywhere to using UCS4 as it's internal Unicode representation. I use C11's U"unicode literals"
for defining strings, which expand to arrays of char32_t
, which are uint32_t
essentially.
Problem is with properly annotating printf
-like functions. As "format" is no longer char*
, compiler refuses to compile it further, as well it won't be happy with char32_t *
instead of char *
for %s
format, I suppose.
I don't depend on stdlib *printf
family at all, so formatting is done purely by mine implementation.
What is correct solution for this, other than just disable this attribute altogether?
python - 为什么相同 Unicode 字符串文字的 id() 会给出不同的结果?
为什么 Unicode 字符串文字显示不同的 id?我希望与字符串文字相同的行为。
请就此提供一些指示。
c++ - VS2013 和 Unicode 文字给出警告
这段代码有什么问题:
完全相同的代码在没有警告的情况下编译并与 GCC 和 Clang 一起使用,但使用 VS2013 我得到:
..对于以字形“y”、“Y”、“”、“Ô”和“ë”开头的行。
c++ - 在 C 中打印 unicode 文字
我正在为 Raspberry Pi 制作一个显示一些文本的 OpenVG 应用程序,并且我需要支持外来字符(在本例中为波兰语)。我计划准备一个函数,将 unicode 字符映射到某种高级语言中的 C 中的文字,但现在在 C 中打印这些文字时存在问题。
鉴于以下代码:
大多数波兰字符都有 3 位十六进制代码。当我尝试打印“ś”(0x15B)时,它会打印字符“[”(0x5B)。事实证明,我无法打印任何超过 2 位代码的 unicode 字符。
使用的数据类型是原因吗?我考虑过使用 char16_t 和 char32_t 但在系统中找不到头文件。
powershell - 将 Unicode 文字分配给 PowerShell 哈希表
已经很晚了,我今晚的工作就完成了——有人可以帮我解决这个问题吗?我是否需要做一些额外的工作才能将这些 Unicode 字符串分配为文字?
第一次尝试创建双编码和所需键值对的哈希表:
我的版本:
收到错误:
python - unicode文字到变量?
简单的新手问题,
为什么??
python - Python 子进程回显一个 unicode 文字
我知道以前有人问过这样的问题。但我没有找到解决方案。
我想使用在我的 python 文件中定义的 unicode 文字和 subprocess 模块。但我没有得到我需要的结果。例如下面的代码
打印出来
如果我将代码更改为
我得到以下
在这个阶段,我只能假设我反复犯了一个简单的错误。但我很难弄清楚它是什么。通过python的子进程调用时,如何让echo打印出以下内容
编辑:
Python的版本是2.7。我在 Windows 8 上运行,但我希望解决方案独立于平台。
python - input() 和文字 unicode 解析
Usinginput()
将反斜杠作为文字反斜杠,因此我无法使用 unicode 解析字符串输入。
我的意思是说:
将字符串粘贴"\uXXXX\uXXXX\uXXXX"
到input()
调用中将被解释为,"\\uXXXX\\uXXXX\\uXXXX"
但我希望将其读取\u
为单个字符而不是两个单独的字符。
有谁知道如何或如果可能的话?
编辑:我接受上述输入并将其转换为 ascii,如下所示..
根据我标记的答案,正确的解决方案是:
haskell - 在 Haskell 字符串中发现的非转义 unicode 文字
小写的 unicodes
是 U+0073 ,这个网站说它是\u0073
用 C 和 Java 编写的。
给定一个文件:a.txt
包含:
让我们用 Java 阅读这个,然后取消转义\
,看看我们得到了什么:
输出是:
unescapeJava(s2)
方法调用从文件中\\u0073
获取 并转义到\u0073
,然后打印为“s”。
我们可以在 Haskell 中做同样的事情吗?
让我们使用文本库来使用这两个文件:
在 Haskell中自动翻译 from \u0073
to的任何期望都可能被执行此类期望的而不是前缀s
混淆:\x
\u
那么如何unescapeJava(..)
在 apace-common-lang 中采用方法,并在 Haskell 中复制其功能以从\\u0073
to 开始\u0073
,并将其打印为“s”?
python - 我可以确保导入我的 Python 代码的用户使用 Unicode 文字吗?
我的代码包括
并且有许多函数接受(并期望)Unicode 字符串作为输入,以便充分发挥作用。
有没有办法确保用户(在脚本、Python 或 IPython 等中)也使用 Unicode 文字,例如
不会导致错误(“ascii”编解码器无法解码字节 0xce ...”),因此
没有必要?