问题标签 [non-ascii-characters]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ® 在解析 XML 时在 Python 中转换为 ®
我的 RSS 提要包含:
现在我正在解析 RSS,然后将标题分配给标题,如下所示:
当我检查输出或日志文件时,我会看到如下标题:
HBO 赢得了 19 项艾美奖,这是今年所有网络中最多的。
® 转换为 ® 。任何我尝试使用 HTML 解析器但没有用的。
jquery - 仅使用 Safari 浏览器添加表单输入的非 ascii 字符
我在使用适用于 Windows 的 Safari 浏览器时遇到了一个奇怪的问题。
我有一个基于 jQuery 的 HTML5 拖放上传表单。它适用于除 Safari 之外的所有浏览器,对于具有特定扩展名的文件,文件名在文件扩展名后用非 ascii 字符填充。
例如,文件example.mov变为example.movçðÆê
文件也已损坏:它们似乎没有内容。
这是 Safari 和 jQuery/HTML5 的已知问题吗?有没有办法过滤掉非ASCII字符?
java - 对非 ascii 字符的错误 java xml 解析
我正在使用 java 小程序浏览远程服务器 (ftp/cifs) 上的文件/文件夹。问题是,如果远程服务器上的文件夹以非 ascii 字符(比如日语或中文)命名,则小程序无法启动。我已经追溯了似乎是由于服务器响应中的非 ascii 字符串解析不正确引起的问题。以下是来自服务器的 xml 响应的片段。
请求来自服务器的字符集编码为 utf-8,如上所述。看起来垃圾的字符串是我尝试使用小程序查看的远程 Web 文件夹,该文件夹实际上命名为“不能正常工作”。由于两者不等价(实际文件夹名称和 xml 中的那个),java xml 解析在尝试启动小程序时会引发错误。请建议可以做些什么来解决这个问题。另外我没有使用 SAX 解析器,我使用的是 XML 解析器,然后创建了一个 DOM 对象
mysql - 数据库未正确存储重音字符
真的很简单,我已将所有排序规则设置为 utf8_general_ci,但是,数据库似乎没有正确存储重音字符
例如,它将“Québec”存储为“Québec”
现在在插入变量之前,它通过以下函数:
另外,我应该提到我在我的 html 中使用了以下元标记:
为什么它没有正确存储值?对我来说完全是无稽之谈。
facebook - Facebook 中的 Lota 角色是个垃圾
当我在 facebook 状态下打印这个字符时,它会像 !̸̶͚͖͖̩̻̩̗͍̮̙̈͊͛̈͒̍̐ͣͩ̋ͨ̓̊̌̈̊́̚͝͠ͅ 这样的垃圾,而且它似乎无处不在,而不是在 Facebook 中,只有我搜索过,发现它是希腊字母表中的第九个字符“Iota”,因为它看起来很垃圾吗?我用非ASCII或其他格式粘贴它还是什么?我真的很想知道
java - 将法语口音转换为百分比编码
我有一个简单的
我应该将此字符串转换为 URL 百分比编码 - 所以我需要:
有什么简单的解决方案吗?
php - PHP - 用重音符号解析 xml
我正在尝试解析包含重音符号的 xml 文件,但出现此错误“无法将字符串解析为 XML”。不幸的是,我无法处理 xml 文件,因为它是从外部源下载的,所以我想知道是否有任何简单的方法来修复它。
这是我的代码:
我环顾四周,但看不到任何问题的解决方案,或者至少我不理解它们!:-)
objective-c - NSData 到 NSString 与 åöä
我正在使用 NSMutableURLRequest 下载一个网页,但是将该网页放入 NSString 时遇到问题。
除了 åäö 等特殊字符外,这很好用。有没有更好的方法?
character-encoding - 如何解码加扰字符编码:特殊字符编码
我有 CSV 格式的数据,这些数据已经被严重扰乱了字符编码,可能在不同的软件应用程序(LibreOffice Calc、Microsoft、Excel、Google Refine、自定义 PHP/MySQL 软件;在 Windows XP、Windows 7 和 GNU/来自世界各地的 Linux 机器......)。似乎在这个过程中的某个地方,非 ASCII 字符已被严重扰乱,我不知道如何解扰它们或检测模式。手动执行此操作将涉及数千条记录...
这是一个例子。对于“Trois-Rivières”,当我在 Python 中打开这部分 CSV 文件时,它会说:
问题:我可以通过什么过程来逆转
去取回
即我该如何解读这个?这怎么可能一开始就被打乱了?我怎样才能对这个错误进行逆向工程?
grails - Grails UrlEncoding 非拉丁字符,如 åäö
我有一些没有拉丁字符的链接资源,例如 åäö 这些通常是用户上传的文件
问题是我没有成功编码它们
使用 filename.encodeAsURL 似乎没有以正确的方式对其进行编码
例如字符 ö 变成 o%CC%88 测试在 Firefox 中键入相同的内容并复制内容给出 %C3%B6
这些编码有什么区别,我应该用什么来获得正确的编码?