问题标签 [mojibake]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2897 浏览

utf-8 - 启用 UTF-8 到 EBCDIC 编码的站点代码

我正在尝试将一个相当大的 UTF-8 文件传输到 Z/OS 数据集。不幸的是,命令

回应

似乎RECFM=VB不起作用。

解决方法是在上传之前将 UTF-8 重新编码为 ISO-8859-1,但在上传时编码更有效。

0 投票
2 回答
7175 浏览

java - Java转换编码

我有一个字符串,它曾经是一个包含 mojibakes 的 xml 标签:
<Applicant_Place_Born>Ð&#156;оÑ&#129;ква</Applicant_Place_Born>

我知道完全相同但编码正确的字符串是:
<Applicant_Place_Born>Москва</Applicant_Place_Born>

我知道这一点是因为使用 Tcl 实用程序我可以将其转换为正确的字符串:

我尝试了不同的变体:

但我总是得到其他mojibakes或问号而不是字符。

问:我怎样才能像 Tcl 一样做但使用 Java 代码?

编辑:

我尝试过@Joop Eggen 的方法:

转换后的字符串是中文的:

JVM encoding: CP1251 Original text: Ð&#156;оÑ&#129;ква Result: 킜킾톁킺킲킰

0 投票
1 回答
51 浏览

python - python unicode:写入文件时,以不同的格式写入

我正在使用 Python 3.4 将 unicode 字符串写入文件。文件写好后,打开一看,完全是另外一组字符。

代码:-

输出:-

提前致谢

0 投票
2 回答
1050 浏览

mysql - 在传输数据库/服务器设置期间使用波兰字符集编码错误

我正在尝试将我的一个数据库从一台主机(home.pl)转移到另一台主机(我新设置的服务器)。我要转移的脚本是 wordpress。不幸的是,无论使用哪种方法,我都在努力解决编码问题。

新主机配置

在我的新服务器中,我在 my.cnf 中使用以下指令:

MySQL 变量:

新服务器上的 Php.ini:

旧主机配置

我在尝试从中传输数据库的旧主机中运行了 SHOW VARIABLES 并得到以下信息:

尝试过的转移方法

1) 通过 phpmyadmin 传输

我尝试过使用 PHPMYADMIN 导出/导入。特别是,我在通过 phpmyadmin 导出和导入期间指出 UTF-8 作为文件字符集。

在源服务器和新主机上的 phpmyadmin 中有什么奇怪的,我看不到波兰字符(没有波兰字符,输出是相同的)。

2)通过mysql转储导出/导入

我也尝试过使用:

但编码也失败了。

也尝试使用编码变量,但也失败了:

转储文件

在我使用带有 UTF-8 编码集的程序员记事本的转储文件中,字符如下所示:

在我看到的 microsoft word 中打开它们

编码转换器 (gżegżółka) 识别文件位于:C:\Users\mkondej001\Desktop\14271425_mk.sql

任何线索如何正确传输数据库/设置服务器变量?

0 投票
0 回答
20 浏览

mysql - 确定 mySQL 数据库的编码 - 网站正确显示字符但 phpmyadmin/dump 文件不正确

我正在尝试确定 mySQL 数据库的编码以解决数据库传输期间的 mojibake 错误(此处描述的问题:在传输数据库/服务器设置期间使用波兰字符集编码错误)。

要成功进行数据库传输,我首先需要 确定什么是原始数据库编码。不幸的是,我不确定它是否确实是 UTF-8,正如我从 mySQL 配置中所期望的那样。

在 phpmyadmin(使用默认设置)导出的文件中,notepad++ 中使用 UTF-8 编码设置的字符如下所示:

编码 Phpmyadmin

在 Notepad++ 中使用不同的样式并没有帮助,而且我总是看到奇怪的字符。

在 phpmyadmin 我看到这样的波兰字符: 在此处输入图像描述

在源服务器上的正常网页上,<meta charset="UTF-8" />一切看起来都正确。

我正在尝试解决我的数据库编码是什么?这是UTF-8吗?如果是,那么为什么没有编辑器可以读取转储的数据?

0 投票
2 回答
64 浏览

mysql - 将脚本传输到新服务器后,编码文件名与 beetwen SQL 和文件系统不匹配

我已将我的 Drupal 站点移至新服务器。不幸的是,现在我所有名称中包含波兰字母的文件链接都已损坏。

我查看了脚本/数据库/文件系统以找出问题所在,并发现以下内容:

  • Drupal 显示以下错误:

/sites/default/files/Baranowska_Badania%20naukowe%20i%20testowanie%20nowych%20lek%C3%B3w%20na%20ludziach%20i%20zwierz%C4%99tach-aspekt%20prawny%20i%20etyczny_0.pdf

  • 该文件存在于服务器上并且可以通过以下链接访问:
  • 在 mysql 中,文件链接如下所示:

如您所见,问题出在链接编码上。SQL 中的文件名包含波兰字母,而 Linux 系统上的真实文件名没有。

我想问你是否有任何简单的方法来解决这个问题,或者唯一的方法是手动将数据库中的所有波兰字符替换为它们各自的非波兰字符(例如。“ę”=>“e”;“ó " => "o")?

0 投票
2 回答
128 浏览

php - 通过 cURL 检索到的 XML 中的 Mojibake 问题

我正在通过 PHP cURL 检索此 XML 提要并将其输出到我页面上的文本区域中。问题是,它回来时充满了 mojibake 角色。饲料本身很好;只有在我的页面上输出时才会出现字符。

例如,英镑符号 (£) 以 £ 的形式返回。

正如对这个问题的回答所建议的那样,我已经尝试在这个问题上抛出 UTF-8 。

在 HTML 中:

甚至通过输出 cURL 响应utf8_encode(),但它们仍然存在。

我什至尝试将这些字符换掉,但这并没有减少。

我在这里无能为力,还是有什么我可以做的?

0 投票
3 回答
5126 浏览

python - Unicode 字符 Ú 和 É 错误地显示为 Ú 和 É

我有一个带有西班牙语文本的 UTF-8 文件,并且某些带有重音符号的单词在某些软件中显示不正确。

我相信我的文件是正确的。例如,名称“JESÚS”编码为4A 45 53 C3 9A 53.

c39a\u00da根据http://www.fileformat.info/info/unicode/char/00da/index.htm是正确的 UTF-8 编码。

那么,为什么有些软件渲染不正确呢?

0 投票
2 回答
80 浏览

python - 来自 MySQL 数据库的数据的编码问题

我有一个存在编码问题的 sql 数据库,因此它返回的结果类似于:

据我所知,这是因为当它应该被编码为 UTF-8 时它被编码为 latin-1(如果我错了,请纠正我)。我正在 Python 脚本中处理这些结果,并且遇到了一些编码问题,并且无法将其转换回应有的状态:

我正在使用 Python 3.3,但通过使用 codecs.decode 将 latin1 更改为 utf-8 我得到:

我想我已经尝试了所有我发现无济于事的事情。我不太热衷于使用 Python 2.7,因为我已经在 3.3 上编写了脚本的其余部分,而且重写会很痛苦。有没有办法做到这一点,我不知道?

0 投票
3 回答
22678 浏览

python - 网站的Python正确编码(美汤)

我正在尝试加载一个 html 页面并输出文本,即使我正确获取了网页,BeautifulSoup 也会以某种方式破坏编码。

资源:

摘录输出:

这应该是Odenwälderisch