“mojibake”的相关标签问题_Stack Overflow中文网

0 投票

0 回答

151 浏览

character-encoding - TinyMCE 菜单栏图标是垃圾/mojibake

我刚刚下载了一份新的 tinymce，上传并尝试在我的 UTF-8 编码网站上使用它。

菜单栏图标要么是垃圾，因为它找不到它的演示文件（字体？），要么是 10000 个文件之一的编码错误。

有谁知道这个bug？我什么都没改，就是上传了。。

在此处输入图像描述

显然，TinyMCE 也不使用我的德语 lang 文件。我将 js 文件放入“langs”文件夹中。

我是否必须为路径、基本路径、...设置任何配置？？

我到 tinymce 的实际路径是scripts/tinymce/tinymce.min.js. 发货包提供的原始路径，tinymce/tinymce/js/tinymce/tinymce.min.js但老实说这种嵌套文件夹没有任何理由..

更新：路径正在工作，它确实读取了未直接链接的文件..（如 theme.min.js）成功。

2014-02-19T15:30:58.240

0 投票

1 回答

845 浏览

python - Python print to terminal shell unicode

I am parsing a long string of persian in python, and am opening it like this:

and using

but instead of printing out readable Persian, it outputs things like this in the terminal.

On the webpage, it outputs it fine.

What is the issue with it? Thank you

python encoding utf-8 codec mojibake

2014-05-01T20:09:16.240

0 投票

1 回答

198 浏览

python - 在 Python 中将 unicode 类型对象写入文件

我正在尝试将 unicode 字符串写入 Python 中的文件，但是当我使用 linux“cat”或“less”读取文件时，没有写入正确的字符，而是显示为垃圾。

我正在从 Oracle 数据库中读取对象。当我打印类型时（其中 a 是数据库结果中的一行）：

它输出：

我打开文件进行写入，如下所示：

我将这一行写入文件，如：

但是当我读取输出文件时，它没有显示正确的重音字符而是垃圾：

如何正确地将 unicode 字符串对象写入 Python 中的文件？

python unicode mojibake

2014-05-24T21:40:57.583

0 投票

1 回答

147 浏览

mysql - 识别编码和转换字符

每隔一段时间，来自中国的客户会在我的网站上下订单，有时他们的姓名和地址信息会以一系列我无法识别或翻译的字符写入 MySQL 数据库。

例如，最近一位客户的收货城市在我看来是这样的：

·s¥_¥«ªo¾ô°Ï

我可以肯定地说，数据库本身以及保存客户信息的字段都设置为 utf8_general_ci 排序规则。该网站本身曾经在其标题中包含以下内容类型声明：

但是最近几周这已经被评论了，我相信试图找出为什么一些中文订单信息是以这样的字符存储的。在它被注释掉之前，上面的相同信息将如下所示：

�s�_��o��

是否有一个在线实用程序可以用来将其中任何一种格式的文本块翻译成 DHL 或其他运输服务可以使用的可读内容？我怎样才能可靠地防止将来以这种方式存储信息？

mysql utf-8 character-encoding chinese-locale mojibake

2014-05-29T16:50:18.643

0 投票

1 回答

3253 浏览

python - 解开 mojibake

当您的字符解码不正确时，您如何识别原始字符串的可能候选者？

我知道这个图像文件名应该是一些日文字符。但是由于对 urllib 引用/取消引用、编码和解码 iso8859-1、utf8 的各种猜测，我无法解开并获得原始文件名。

腐败是可逆的吗？

python unicode character-encoding decoding mojibake

2014-06-10T12:01:30.930

0 投票

1 回答

521 浏览

xml - Munged 字符 - 来自 XML 的磅符号

我正在尝试从 XML 提要中提取 £ 符号（完整版在这里 > http://mjsiphone.com/scotjobsnet/）

迷你版在这里 > http://scotjobsnet.co.uk.ni.strategiesuk.net/testfeed.xml

我无法控制提要的来源或源服务器，也无法控制提要的格式、它们使用的标头等等。

我只需要构建一个 .NET 4.5 控制台应用程序，它将提取数据并将其保存在我们自己的站点数据库中。

此外，我必须删除所有 HTML（从职位描述中）并删除任何 HTML 编码字符并用它们的真实值替换它们。

因此，我需要在 MS SQL 2008 DB 中以 nvarchar 数据类型保存真正的 £ 符号，而不是 20,000 英镑或 20,000 英镑等。

查看提要的来源时，它的顶部有 UTF-8。

但是，在浏览器源中查看提要时，我没有看到将 UTF-8 作为请求/响应标头，在请求标头 (Chrome) 中我只看到：

接受语言：en-GB,en-US;q=0.8,en;q=0.6

当我将浏览器或控制台中的字符复制并粘贴到 SQL 中并检查它们时，它们返回 163，这是正确的 ASCII 字符编码，例如 £

如果您在浏览器中查看提要，英镑符号会显示得很好。

当我将内容输出到 Windows 命令控制台时，它们会显示为 £ 符号。

但是，当我尝试将它们保存到数据库或通过管道将控制台调试输出到 EditPlus 中的文件（字符编码设置为 UTF8 或 ASCII）时，我只是在数字前面得到正方形而不是在 CMD 中的符号

[.exe 的路径] > [debug.log 文件的路径]

控制台无法正确地将内容传递给编辑器，或者我需要使用正确的编码或传递更多标题或以不同方式提取 XML。

这是我用于测试的代码示例，仅使用一个在其中使用 £ 符号的字段，然后中断。

任何帮助都感激不尽。

我确定这只是我需要传递的标头，或者可能是将 XML 内容输出到编辑器的问题。

正如我在 Windows 控制台中查看输出之前所说，£ 显示良好。

谢谢

xml encoding utf-8 character-encoding mojibake

2014-06-11T11:52:30.610

0 投票

1 回答

66 浏览

mysql - JSF2.0: Mojibake for primefaces4.0

Mojibake problem

[I use netbeans - jsf 2.2 - primefaces 4.0 - Mysql database]

I use Arabic in my JSF application and unfortunately the Arabic values sent to the server as other characters like this (Ø¨ÙÙØ³ ÙØ¨ ) (seen by debugger) and so stored in database like this.

the project work well at the beginning but after I do some other tasks in my project this problem occur but what cause the problem I do not know

the following solutions done but no effect

use the following line at every jsf page (.xhtml page)

use the following filter

and also I try my written filter

I use the form like this

Any one can help me

mysql jsf netbeans primefaces mojibake

2014-07-03T10:24:44.693

0 投票

1 回答

1659 浏览

python - utf-8中字符的编码问题

我通过使用漂亮的汤库从网页获取链接a.get('href')。在链接中有一个奇怪的字符®，但当我得到它时Â®。如何正确编码？我已经在页面开头添加了# -*- coding: utf-8 -*-

python utf-8 beautifulsoup python-requests mojibake

2014-07-16T20:39:01.603

0 投票

2 回答

457 浏览

python - 如何在python中用前面的数字分割utf-8字符串？

我得到了一个原始的 utf-8 字符串：

我把它转换成字符串

我想将该数字 1 与其余字符串分开。

然后我尝试了：

不是我想的那样。

终于，我的脑海里闪过一丝火花，我做到了：

但问题是，我无法确保其他此类组合中的 utf-8 代码以 '\xe6' 开头，因此我需要一种方法来区分具有任意 utf-8 代码的数字，然后将它们分开。

有可能这样做吗？

python string utf-8 split mojibake

2014-08-16T03:29:28.193

0 投票

2 回答

958 浏览

python - Python Codecs 包无法解码字节

我正在使用 Python 2.7.3 和 BeuatofulSoup 从网站的表格中获取数据，然后使用codecs将内容写入文件。我收集的变量之一，偶尔会出现乱码。例如，如果网站表看起来像这样

因此，当我生成City变量时，我总是将其编码为utf-8：

所以我创建的逗号分隔字符串列表的内容被称为RowData并且RowHeaders看起来像这样

然后我尝试使用以下代码将其写入文件

我收到以下错误

我可以使用 csv writer 包RowsData，它工作正常。由于我不想进入的原因，我需要使用编解码器来输出 csv 文件。我不知道发生了什么。谁能帮我解决这个问题？提前致谢。

python python-2.7 encoding utf-8 mojibake

2014-08-20T07:24:24.183

问题标签 [mojibake]

Reference