问题标签 [unicode-escapes]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
126 浏览

java - 如何从 Java 中的原始 utf 格式中获取真实字符

我有一些像这样编码的汉字:

怎样才能把字符串b改成真正的字符,我发现在控制台输出的时候可以显示下面的c,那么问题是如何把字符串b改成c呢?

0 投票
1 回答
2395 浏览

perl - 如何仅对 Perl 字符串中的 \xhh 字符进行“解码 'unicode-escape'”?

我有一个包含以下内容的文件,其中一些字符是 UTF-8 十六进制编码的字符串文字:

我想读取文件并将文件中的 UTF-8 十六进制编码字符解码为它们代表的实际 unicode 字符,然后写入一个新文件。鉴于上述内容,当您在 UTF-8 编码的文本编辑器中打开新文件时,它应如下所示:

请注意,双引号仍然被转义,UTF-8 十六进制编码\xC3\x96现在变成了 Ö(U+00D6 拉丁大写字母 O 带分音符号)。

我有部分工作的代码,如下所示:

然而,问题在于,所有其他转义序列(\"例如decode 'unicode-escape', $_. 所以最后,我得到以下信息:

我尝试以 UTF-8 编码和/或使用Unicode::Escape::unescape诸如

但他们都没有解码\xhh转义序列。

基本上我想要的只是 的行为decode 'unicode-escape', $_,但它应该只在\xhh转义序列上解码并忽略其他转义序列。

这可能吗?使用decode 'unicode-escape', $_适合这种情况吗?还有什么办法吗?谢谢!

0 投票
3 回答
5901 浏览

python - 解码函数尝试对 Python 进行编码

我正在尝试打印一个没有特定编码十六进制的 unicode 字符串。我正在从 facebook 获取这些数据,该数据在 UTF-8 的 html 标头中具有编码类型。当我打印类型时 - 它说它的 unicode,但是当我尝试使用 unicode-escape 对其进行解码时说存在编码错误。为什么当我使用解码方法时它试图编码?

代码

0 投票
2 回答
8061 浏览

bash - 如何在 bash shell 脚本中的变量中容纳空格?

希望这应该是一个简单的...这是我的 test.sh 文件:

注意“我的目录”中的空格。当我执行它时,

我不知道如何在变量中容纳空间并仍然执行命令。但是在 bash shell 上执行以下操作没有问题。

任何建议将不胜感激!我在 Windows 上使用来自 cygwin 的 bash。

0 投票
2 回答
3513 浏览

mysql - 命令行 MySQL 中的 Unicode 转义序列

简洁版本:

可以使用哪种转义序列在命令行 mysql 中搜索 unicode 字符?

长版:

我正在寻找一种方法来从命令行在 mysql 中搜索包含 unicode 序列 U+200B 的记录的列。我无法弄清楚使用哪种逃生方式。我已经尝试过 \u200B 和x200B,甚至我终于找到了一篇建议使用 _utf8 语法的博客。这将在命令行上生成字符:

现在我被困在试图让它在“LIKE”查询中工作。

这会生成字符,但 % 放在 LIKE 部分时似乎失去了特殊含义:

我也尝试了一个 concat 但它也不起作用:

更多背景:

我有一些数据中包含零宽​​度空格字符 (zwsp),Unicode 点 U+200B。这通常是由在其输出中使用 zwsp 的网站复制/粘贴引起的。对于大多数 unicode 字符,我可以将字符粘贴到终端中(或使用键码创建),但由于这个字符是不可见的,因此更具挑战性。我可以创建一个生成“%%”序列的文件并将其复制/粘贴到终端,它会工作,但它会使我的命令历史记录和终端输出变得混乱。我认为在 MySQL 中有一种简单的方法可以做到这一点,但到目前为止我还不够。

提前致谢,

——保罗·伯尼

0 投票
4 回答
4451 浏览

eclipse - 用 unicode 转义序列替换特殊字符的 Eclipse 快捷键

Ecplise 中是否有允许用其 unicode 转义序列 (\uXXXX) 替换特殊字符(重音)的快捷键?

0 投票
3 回答
9793 浏览

java - Java 和 JS/AS3 之间 URL 解码/编码 UTF-8 的差异(错误!?)

我在用 Javascript 或 Actionscript 3 编码的 Java 中对 UTF-8 字符串进行 URL 解码时遇到问题。我设置了一个测试用例,如下所示:

有问题的字符串是 Produktgröße

当我使用 JS/AS3 编码时,我得到以下字符串:

产品gr%F6%DFe

当我用 JS 取消这个时,我没有任何变化

产品gr%F6%DFe

所以,由此我假设 JS 没有正确编码字符串?

以下 JSP 产生此输出

产品

产品gr%C3%B6%C3%9Fe

产品gr%C3%B6%C3%9Fe

Produktgröße

Produktgröße

知道为什么我与语言存在这种差异以及为什么 JS/AS3 的行为不像我预期的那样吗?

谢谢。

0 投票
2 回答
756 浏览

python - 在 Python 中转义转义序列

我对python有点陌生。目标是使用子进程解析执行 shell 命令并从 shell 中检索打印输出。执行错误如下面的示例输出消息所示。下面还显示了示例代码片段

代码片段:

输出:

是否有可以使用的解决方法或功能?

感谢您的帮助 谢谢

0 投票
12 回答
114052 浏览

java - 在java中将国际字符串转换为\u代码

如何将国际(例如俄语)字符串转换为\u数字(unicode 数字) ,
例如\u041e\u041afor OK

0 投票
1 回答
4682 浏览

xml - 来自 /dev/random 的随机文本在 lxml 中引发错误:所有字符串必须与 XML 兼容:Unicode 或 ASCII,没有 NULL 字节

为了测试我的网络应用程序,我将 /dev/random 中的一些随机字符粘贴到我的网络前端。此行会引发错误:

在我提交用户输入的字符串之前,我正在这样做:

comment.decode('utf-8').encode('utf-8', "替换")

但这在这种情况下似乎没有帮助。

——阿比