问题标签 [non-ascii-characters]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
506 浏览

python - ® 在解析 XML 时在 Python 中转换为 ®

我的 RSS 提要包含:

现在我正在解析 RSS,然后将标题分配给标题,如下所示:

当我检查输出或日志文件时,我会看到如下标题:

HBO 赢得了 19 项艾美奖,这是今年所有网络中最多的。

® 转换为 ® 。任何我尝试使用 HTML 解析器但没有用的。

0 投票
1 回答
1255 浏览

jquery - 仅使用 Safari 浏览器添加表单输入的非 ascii 字符

我在使用适用于 Windows 的 Safari 浏览器时遇到了一个奇怪的问题。

我有一个基于 jQuery 的 HTML5 拖放上传表单。它适用于除 Safari 之外的所有浏览器,对于具有特定扩展名的文件,文件名在文件扩展名后用非 ascii 字符填充。

例如,文件example.mov变为example.movçðÆê

文件也已损坏:它们似乎没有内容。

这是 Safari 和 jQuery/HTML5 的已知问题吗?有没有办法过滤掉非ASCII字符?

0 投票
1 回答
836 浏览

java - 对非 ascii 字符的错误 java xml 解析

我正在使用 java 小程序浏览远程服务器 (ftp/cifs) 上的文件/文件夹。问题是,如果远程服务器上的文件夹以非 ascii 字符(比如日语或中文)命名,则小程序无法启动。我已经追溯了似乎是由于服务器响应中的非 ascii 字符串解析不正确引起的问题。以下是来自服务器的 xml 响应的片段。

请求来自服务器的字符集编码为 utf-8,如上所述。看起来垃圾的字符串是我尝试使用小程序查看的远程 Web 文件夹,该文件夹实际上命名为“不能正常工作”。由于两者不等价(实际文件夹名称和 xml 中的那个),java xml 解析在尝试启动小程序时会引发错误。请建议可以做些什么来解决这个问题。另外我没有使用 SAX 解析器,我使用的是 XML 解析器,然后创建了一个 DOM 对象

0 投票
2 回答
1208 浏览

mysql - 数据库未正确存储重音字符

真的很简单,我已将所有排序规则设置为 utf8_general_ci,但是,数据库似乎没有正确存储重音字符

例如,它将“Québec”存储为“Québec”

现在在插入变量之前,它通过以下函数:

另外,我应该提到我在我的 html 中使用了以下元标记:

为什么它没有正确存储值?对我来说完全是无稽之谈。

0 投票
1 回答
214 浏览

facebook - Facebook 中的 Lota 角色是个垃圾

当我在 facebook 状态下打印这个字符时,它会像 ‎!̸̶͚͖͖̩̻̩̗͍̮̙̈͊͛̈͒̍̐ͣͩ̋ͨ̓̊̌̈̊́̚͝͠ͅ 这样的垃圾,而且它似乎无处不在,而不是在 Facebook 中,只有我搜索过,发现它是希腊字母表中的第九个字符“Iota”,因为它看起来很垃圾吗?我用非ASCII或其他格式粘贴它还是什么?我真的很想知道

0 投票
2 回答
3928 浏览

java - 将法语口音转换为百分比编码

我有一个简单的

我应该将此字符串转换为 URL 百分比编码 - 所以我需要:

有什么简单的解决方案吗?

0 投票
2 回答
2618 浏览

php - PHP - 用重音符号解析 xml

我正在尝试解析包含重音符号的 xml 文件,但出现此错误“无法将字符串解析为 XML”。不幸的是,我无法处理 xml 文件,因为它是从外部源下载的,所以我想知道是否有任何简单的方法来修复它。

这是我的代码:

我环顾四周,但看不到任何问题的解决方案,或者至少我不理解它们!:-)

0 投票
1 回答
452 浏览

objective-c - NSData 到 NSString 与 åöä

我正在使用 NSMutableURLRequest 下载一个网页,但是将该网页放入 NSString 时遇到问题。

除了 åäö 等特殊字符外,这很好用。有没有更好的方法?

0 投票
2 回答
12203 浏览

character-encoding - 如何解码加扰字符编码:特殊字符编码

我有 CSV 格式的数据,这些数据已经被严重扰乱了字符编码,可能在不同的软件应用程序(LibreOffice Calc、Microsoft、Excel、Google Refine、自定义 PHP/MySQL 软件;在 Windows XP、Windows 7 和 GNU/来自世界各地的 Linux 机器......)。似乎在这个过程中的某个地方,非 ASCII 字符已被严重扰乱,我不知道如何解扰它们或检测模式。手动执行此操作将涉及数千条记录...

这是一个例子。对于“Trois-Rivières”,当我在 Python 中打开这部分 CSV 文件时,它会说:

问题:我可以通过什么过程来逆转

去取回

即我该如何解读这个?这怎么可能一开始就被打乱了?我怎样才能对这个错误进行逆向工程?

0 投票
1 回答
999 浏览

grails - Grails UrlEncoding 非拉丁字符,如 åäö

我有一些没有拉丁字符的链接资源,例如 åäö 这些通常是用户上传的文件

问题是我没有成功编码它们

使用 filename.encodeAsURL 似乎没有以正确的方式对其进行编码

例如字符 ö 变成 o%CC%88 测试在 Firefox 中键入相同的内容并复制内容给出 %C3%B6

这些编码有什么区别,我应该用什么来获得正确的编码?