问题标签 [unicode-escapes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1199 浏览

python - Python DELETE 字符(Unicode 7F)似乎没有做任何事情。它不应该删除后续字符,还是我做错了?

我进入我的 Python shell 并对其进行了测试,结果如下:

根据我对这个字符的理解,它应该没有在那个字符串中显示空格。我究竟做错了什么?

0 投票
1 回答
924 浏览

android - 在android上处理包含特殊字符的JSON数据的转储和重新加载的正确方法?

不确定是否已经回答了这个问题,但是快速搜索并没有得到令人满意的结果。
我遇到了以下情况:

  • 具有 REST API 和 JSON 格式数据块的 Web 服务
  • android 客户端应用程序与此服务通信并在本地缓存/处理数据

we 服务由一家德国公司运营,因此结果数据中的某些字符串包含特殊字符,例如德语变音符号:

在本地,应用程序使用一组反映响应对象的类(例如,上例的RewardRewardResponse类)来解析数据。这些类中的每一个都可以从/到 JSON 读取和转储自身 - 然而这就是事情变得丑陋的地方。

以上面的例子为例,org.json 将正确解析数据,生成的字符串将包含特殊字符 'ß' ( \u00df ) 和 'ü' ( \u00fc ) 的正确 Unicode 版本。

如您所见,加载JSONObject.toString()生成的数据时存在问题。
主要发生的事情是JSONObject将以“\uXXXX”的形式解析转义,但它会将它们转储为纯 UTF-8 文本。

反过来,在解析时,它不会正确读取 unicode,而是在结果字符串中插入替换字符(在\uffff上方作为代码点)。

我当前的解决方法包括一个查找表,其中包含 Unicode Latin1 补充字符及其各自的转义版本(\u00a0\u00ff)。但这也意味着我必须检查每一个转储的 JSON 文本,并在每次转储某些内容时用转义版本替换字符。

请告诉我有更好的方法!

(注意:有这个问题,但是他在磁盘上的本地文件编码有问题。
如您所见,我上面的问题是可以重现的,而无需写入磁盘)

编辑:根据评论中的要求,这里是toJSON()方法:

作为旁注,如果我使用JSONObject.toString()JSONStringer没有区别。(文档建议使用.toString()

编辑:只是为了从等式中删除奖励,这会重现问题:

0 投票
2 回答
2334 浏览

java - 在Java中获取Unicode值的字符表示

我想要 Java 中 Unicode 值的字符表示。这可以做到吗?

XML 不支持某些字符(例如 unicode 值为 \u001b 的字符)。所以我通过输入 Unicode 值 '\u001b' 在 XML 中转义它们,并且在解组后,我希望显示 \u001b 的字符表示。这可以用 Java 完成吗?

欢迎提出建议。

0 投票
3 回答
1618 浏览

java - '\' 在 Java 中的 StringObject.ReplaceAll 方法中被自动剥离

我正在使用 Jre 1.6。我正在执行以下代码行:

字符串 unicodeValue = "\u001B"; text = text.replaceAll("" + character, unicodeValue);

此处,文本是一个字符串对象,其中包含 Unicode 值“\u001B”的无效 XML 字符。因此,我将无效的 XML 字符转换为其 Unicode 值以写入 XML。

但是在执行 text.replaceAll 时,“\”被剥离,字符被“u001B”替换。

任何人都可以建议一种在用其 unicode 值替换字符后保留 '\' 的方法吗?

0 投票
2 回答
1349 浏览

php - PHP PCRE Unicode 转义

我正在使用一个包含带有“\uXXXX”的表达式的正则表达式数据库,这当然会破坏 PHP PCRE。

那么,两个部分的问题,有没有办法告诉 PCRE 接受这些序列?

我解决了这个问题,幸运的是,这只是一个序列,方法是:

$regx = str_ireplace('\u00a7', '\xa7', $regx);

但是当我试图这样做时:

$regx = preg_replace("/\\u(\w+)/i", "\x$1", $regx);

我仍然得到 -

警告:preg_replace() [function.preg-replace]:编译失败:PCRE 在偏移量 1 处不支持 \L、\l、\N{name}、\U 或 \u

它需要双重转义 \u => \\\\u,而不仅仅是 \\u,为什么/有更好的方法?注意:我实际上必须做同样的事情,更重要的是,才能将正确的字符串放入这篇文章。

更新:在我们的服务器上运行 5.3.3

0 投票
1 回答
1123 浏览

ios - 检查字符的Unicode值范围

在 Objective-C 中...

如果我有一个像“Δ”这样的字符,我怎样才能得到 unicode 值,然后确定它是否在某个值范围内。

例如,如果我想知道某个字符是否在 to 的 unicode 范围U+1F300U+1F6FF

0 投票
1 回答
658 浏览

ruby - ruby unicode 转义为命令行参数

看起来这个问题是由 python 开发人员提出的(Allowing input of Unicode escapes as command line arguments),我认为这部分相关,但它并没有完全解决我在 Ruby 中的直接问题。我很好奇是否有办法将转义的 unicode 序列作为命令行参数,分配给一个变量,然后在脚本运行后处理转义的 unicode 并显示为正常的 unicode。基本上,我希望能够选择一个 unicode 数字,然后让 Ruby 将其粘贴在文件名中并显示实际的 unicode 字符。

以下是我注意到的一些导致问题的事情:

将字符串视为 unicode 序列所需的正斜杠被剥离。然后,如果我们尝试添加另一个“\”来转义它,

但它仍然不会被正确处理。

这是一些更相关的代码,我实际上正在尝试实现这一点:

看起来这应该很简单,但我已经搜索和搜索,找不到解决方案。我应该补充一点,我知道在字符串中提供硬编码的转义 unicode 效果很好,比如File.new("\u263a.#{filetype}", "w"),但是从参数/变量中获取它是我遇到的问题。我正在使用 Ruby 1.9.2。

0 投票
1 回答
67437 浏览

python - 在python2.7中删除字符串中的unicode \u2026之类的字符

我在python2.7中有一个这样的字符串,

我如何将其转换为这个,

0 投票
1 回答
380 浏览

php - 加泰罗尼亚字符 à 和 è 不适用于 php imagestringup - 如何解码它们?

当我用 $text 和西班牙语调用下面的代码时,我得到了正确的带有图像的文本,但是当我用加泰罗尼亚语用 $text 调用相同的代码时,我没有在图像中得到正确的文本。我知道西班牙语特殊字符á 和 é有效,但加泰罗尼亚语字符à 和 è无效。

你能帮我纠正这个问题吗?

0 投票
2 回答
3408 浏览

c# - 将转义的 unicode 字符串转换为字节数组

我的输入字符串由混合了 Unicode 转义字符和常规字符的混合组成。示例:

如何将其转换为字节数组或流?

预期输出为 Byte[]