问题标签 [mojibake]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3472 浏览

python - 使用python清理文本文件中的字符串编码问题

我有很多外部文件的 XML 文档和文件名,这些文件在导入过程中存在各种形式的文本损坏或 Mojibake 导致数据质量问题。我在 StackOverflow 上阅读了许多关于更正字符串的不同帖子,但它们未能真正概述如何以系统的方式清理文本,而 pythondecode似乎encode没有帮助。如何使用 Python 2.7 恢复包含 Latin-1 (ISO-8859-1) 范围内的字符但通常具有混合编码的 XML 文件和文件名?

0 投票
1 回答
680 浏览

python - 如何使用python编码字符串

我有元素列表

我尝试使用

并得到了它

我做错了什么?

0 投票
1 回答
4325 浏览

excel - 西里尔字母到英语或拉丁语

我希望你们一切都好。我有一个包含西里尔字母的 Excel 表。我想把它变成英语/拉丁语 Excel 有什么简单的方法可以做到这一点吗?预先感谢您的帮助。

在此处输入图像描述

0 投票
1 回答
716 浏览

ios - 中文字符而不是非拉丁字符(Mojibake 错误?!)

使用react-native v0.31.0on iOS(当前 oniOS9iOS10)。

我在 a 中有一个非拉丁文本<Text> Component,有时我看到它是这样的: 在此处输入图像描述

但它实际上应该是这样的: 在此处输入图像描述

我的走动是:

  • 嗅探网络,数据看起来应该
  • iOS本机端和要绘制的数据已经损坏

我看到了这些相关的问题:

而这个公关:

但是这些都没有为我解决这个问题。

这种行为只是间歇性地发生,但在连接速度较慢的情况下,它会始终如一地发生。

有没有人遇到过这个问题?任何帮助将不胜感激。提前致谢。

0 投票
2 回答
978 浏览

python - python替换unicode字符

我写了一个程序来读取Windows DNS调试日志,但里面总是在域字段中出现一些有趣的字符。

下面是一个例子:

我想\x..用一个替换所有?

我明确键入 \xc2 如下作品

但如果我写如下,它就不起作用:

re.sub('\\\x..', '?', line)

我如何编写一个正则表达式来替换它们?

0 投票
2 回答
1657 浏览

python - Python:将一些编码转换为俄语字母

我有 unicode 列表

我尝试将一些喜欢转换u'\xd0\xbe'为俄语。我尝试使用 2 和 3 python,但我不能这样做。我使用 IDE Pycharm,在设置中我有默认的 utf-8。当我用

它返回我о的第一个元素。当我尝试print (elem.encode('cp1252')) 它返回b'\xd0\xbe' 当我使用chardet.detect它返回我时,它是utf-8. 任何人都可以向我解释,我怎样才能将它转换为俄语字母以及为什么我使用的方法不适合得到它。

0 投票
1 回答
706 浏览

unicode - 蚊清保留mojibake话题

由于我的崩溃程序,我发布了一个 mojibake 主题,��部分是一些随机字节码,例如

如果我想清除它,我输入类似

但这不起作用,因为这些�字符不是原始�,这些编解码器在 ascii 和 unicode 中不匹配,因此呈现为�字符。

如何在不删除整个保留文件的情况下清除这些保留消息?

谢谢!

0 投票
1 回答
1073 浏览

python - 如何检测字符串是否已经 utf8 编码?

我有一些这样的字符串:

这是“Thaïlande”,我不知道它是如何编码的,但我需要将它带回“Thaïlande”,然后对其进行 URL 编码。

有没有办法猜测一个字符串是否已经用 Python 2 编码?

0 投票
0 回答
51 浏览

http - 如何使用未知算法解码字符串?

我使用 Fiddler 捕获 http 请求,但在 http 正文中遇到 mojibake。

mojibake http 请求 img

我将 http 正文复制为 bas64 编码并尝试知道它是什么。

有base64编码字符串:

有我的php代码:

php结果img

已经是mojibake了。如何解码?

0 投票
1 回答
60 浏览

netbeans - JavaFX 中的 Mojibake(在 Netbeans 中运行良好)

使用 JavaFX 在 Netbeans 中处理一个简单的翻译器项目。从 Netbeans 运行它,它可以完美地编译和运行。没有渲染问题:

从 Netbeans 启动时的外观

但是当运行相同的可执行文件([project-folder]\dist\Translator.jar)时:

\dist\Translator.jar 中的 mojibake

莫吉贝克。([project-folder]\dist\run##########\Translator.jar) 同样的事情:

\dist\run中的mojibake##########\Translator.jar

文本可能在四个地方出现格式错误:将术语列表发送给翻译人员,翻译人员使用 Web 服务检索翻译 (1)。然后将这些缓存在文件 (2) 中,并由解析器 (3) 加载,从而使数据可用于在 JavaFX 窗口 (4) 中显示。我检查了这些文件,它们是有效的 UTF-8,解析器仅在加载现有文件时运行,新部署不会有任何文件。因此,我将其缩小到 JavaFX 窗口中的显示。