“unicode-escapes”的相关标签问题

0 投票

1 回答

1199 浏览

python - Python DELETE 字符（Unicode 7F）似乎没有做任何事情。它不应该删除后续字符，还是我做错了？

我进入我的 Python shell 并对其进行了测试，结果如下：

根据我对这个字符的理解，它应该没有在那个字符串中显示空格。我究竟做错了什么？

2012-12-10T11:00:56.247

0 投票

1 回答

924 浏览

android - 在android上处理包含特殊字符的JSON数据的转储和重新加载的正确方法？

不确定是否已经回答了这个问题，但是快速搜索并没有得到令人满意的结果。
我遇到了以下情况：

具有 REST API 和 JSON 格式数据块的 Web 服务
android 客户端应用程序与此服务通信并在本地缓存/处理数据

we 服务由一家德国公司运营，因此结果数据中的某些字符串包含特殊字符，例如德语变音符号：

在本地，应用程序使用一组反映响应对象的类（例如，上例的Reward和RewardResponse类）来解析数据。这些类中的每一个都可以从/到 JSON 读取和转储自身 - 然而这就是事情变得丑陋的地方。

以上面的例子为例，org.json 将正确解析数据，生成的字符串将包含特殊字符 'ß' ( \u00df ) 和 'ü' ( \u00fc ) 的正确 Unicode 版本。

如您所见，加载JSONObject.toString()生成的数据时存在问题。
主要发生的事情是JSONObject将以“\uXXXX”的形式解析转义，但它会将它们转储为纯 UTF-8 文本。

反过来，在解析时，它不会正确读取 unicode，而是在结果字符串中插入替换字符（在\uffff上方作为代码点）。

我当前的解决方法包括一个查找表，其中包含 Unicode Latin1 补充字符及其各自的转义版本（\u00a0到\u00ff）。但这也意味着我必须检查每一个转储的 JSON 文本，并在每次转储某些内容时用转义版本替换字符。

请告诉我有更好的方法！

（注意：有这个问题，但是他在磁盘上的本地文件编码有问题。
如您所见，我上面的问题是可以重现的，而无需写入磁盘）

编辑：根据评论中的要求，这里是toJSON()方法：

作为旁注，如果我使用JSONObject.toString()或JSONStringer没有区别。（文档建议使用.toString()）

编辑：只是为了从等式中删除奖励，这会重现问题：

android json encoding unicode-escapes

2013-01-11T08:31:40.450

0 投票

2 回答

2334 浏览

java - 在Java中获取Unicode值的字符表示

我想要 Java 中 Unicode 值的字符表示。这可以做到吗？

XML 不支持某些字符（例如 unicode 值为 \u001b 的字符）。所以我通过输入 Unicode 值 '\u001b' 在 XML 中转义它们，并且在解组后，我希望显示 \u001b 的字符表示。这可以用 Java 完成吗？

欢迎提出建议。

java xml unicode unicode-escapes

2013-01-24T08:57:21.113

0 投票

3 回答

1618 浏览

java - '\' 在 Java 中的 StringObject.ReplaceAll 方法中被自动剥离

我正在使用 Jre 1.6。我正在执行以下代码行：

字符串 unicodeValue = "\u001B"; text = text.replaceAll("" + character, unicodeValue);

此处，文本是一个字符串对象，其中包含 Unicode 值“\u001B”的无效 XML 字符。因此，我将无效的 XML 字符转换为其 Unicode 值以写入 XML。

但是在执行 text.replaceAll 时，“\”被剥离，字符被“u001B”替换。

任何人都可以建议一种在用其 unicode 值替换字符后保留 '\' 的方法吗？

java unicode unicode-string replaceall unicode-escapes

2013-01-31T05:11:17.007

0 投票

2 回答

1349 浏览

php - PHP PCRE Unicode 转义

我正在使用一个包含带有“\uXXXX”的表达式的正则表达式数据库，这当然会破坏 PHP PCRE。

那么，两个部分的问题，有没有办法告诉 PCRE 接受这些序列？

我解决了这个问题，幸运的是，这只是一个序列，方法是：

$regx = str_ireplace('\u00a7', '\xa7', $regx);

但是当我试图这样做时：

$regx = preg_replace("/\\u(\w+)/i", "\x$1", $regx);

我仍然得到 -

警告：preg_replace() [function.preg-replace]：编译失败：PCRE 在偏移量 1 处不支持 \L、\l、\N{name}、\U 或 \u

它需要双重转义 \u => \\\\u，而不仅仅是 \\u，为什么/有更好的方法？注意：我实际上必须做同样的事情，更重要的是，才能将正确的字符串放入这篇文章。

更新：在我们的服务器上运行 5.3.3

php unicode pcre unicode-escapes

2013-02-04T15:08:01.503

0 投票

1 回答

1123 浏览

ios - 检查字符的Unicode值范围

在 Objective-C 中...

如果我有一个像“Δ”这样的字符，我怎样才能得到 unicode 值，然后确定它是否在某个值范围内。

例如，如果我想知道某个字符是否在 to 的 unicode 范围U+1F300内U+1F6FF

ios objective-c string unicode unicode-escapes

2013-02-11T23:20:09.507

0 投票

1 回答

658 浏览

看起来这个问题是由 python 开发人员提出的（Allowing input of Unicode escapes as command line arguments），我认为这部分相关，但它并没有完全解决我在 Ruby 中的直接问题。我很好奇是否有办法将转义的 unicode 序列作为命令行参数，分配给一个变量，然后在脚本运行后处理转义的 unicode 并显示为正常的 unicode。基本上，我希望能够选择一个 unicode 数字，然后让 Ruby 将其粘贴在文件名中并显示实际的 unicode 字符。

以下是我注意到的一些导致问题的事情：

将字符串视为 unicode 序列所需的正斜杠被剥离。然后，如果我们尝试添加另一个“\”来转义它，

但它仍然不会被正确处理。

这是一些更相关的代码，我实际上正在尝试实现这一点：

看起来这应该很简单，但我已经搜索和搜索，找不到解决方案。我应该补充一点，我知道在字符串中提供硬编码的转义 unicode 效果很好，比如File.new("\u263a.#{filetype}", "w")，但是从参数/变量中获取它是我遇到的问题。我正在使用 Ruby 1.9.2。

ruby unicode-escapes

2013-02-16T03:24:36.503

0 投票

1 回答

67437 浏览

python - 在python2.7中删除字符串中的unicode \u2026之类的字符

我在python2.7中有一个这样的字符串，

我如何将其转换为这个，

python python-2.7 non-ascii-characters python-unicode unicode-escapes

2013-03-10T10:17:18.867

0 投票

1 回答

380 浏览

php - 加泰罗尼亚字符 à 和 è 不适用于 php imagestringup - 如何解码它们？

当我用 $text 和西班牙语调用下面的代码时，我得到了正确的带有图像的文本，但是当我用加泰罗尼亚语用 $text 调用相同的代码时，我没有在图像中得到正确的文本。我知道西班牙语特殊字符á 和 é有效，但加泰罗尼亚语字符à 和 è无效。

你能帮我纠正这个问题吗？

php unicode utf8-decode unicode-escapes

2013-04-18T09:36:51.640

0 投票

2 回答

3408 浏览

c# - 将转义的 unicode 字符串转换为字节数组

我的输入字符串由混合了 Unicode 转义字符和常规字符的混合组成。示例：

如何将其转换为字节数组或流？

预期输出为 Byte[]

c#unicode-escapes

2013-05-13T19:41:29.217

问题标签 [unicode-escapes]

python - Python DELETE 字符（Unicode 7F）似乎没有做任何事情。它不应该删除后续字符，还是我做错了？

android - 在android上处理包含特殊字符的JSON数据的转储和重新加载的正确方法？

java - 在Java中获取Unicode值的字符表示

java - '\' 在 Java 中的 StringObject.ReplaceAll 方法中被自动剥离

php - PHP PCRE Unicode 转义

ios - 检查字符的Unicode值范围

ruby - ruby unicode 转义为命令行参数

python - 在python2.7中删除字符串中的unicode \u2026之类的字符

php - 加泰罗尼亚字符 à 和 è 不适用于 php imagestringup - 如何解码它们？

c# - 将转义的 unicode 字符串转换为字节数组

问题标签 [unicode-escapes]

Reference