问题标签 [mojibake]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
character-encoding - TinyMCE 菜单栏图标是垃圾/mojibake
我刚刚下载了一份新的 tinymce,上传并尝试在我的 UTF-8 编码网站上使用它。
菜单栏图标要么是垃圾,因为它找不到它的演示文件(字体?),要么是 10000 个文件之一的编码错误。
有谁知道这个bug?我什么都没改,就是上传了。。
显然,TinyMCE 也不使用我的德语 lang 文件。我将 js 文件放入“langs”文件夹中。
我是否必须为路径、基本路径、...设置任何配置??
我到 tinymce 的实际路径是scripts/tinymce/tinymce.min.js
. 发货包提供的原始路径,tinymce/tinymce/js/tinymce/tinymce.min.js
但老实说这种嵌套文件夹没有任何理由..
更新:路径正在工作,它确实读取了未直接链接的文件..(如 theme.min.js)成功。
python - Python print to terminal shell unicode
I am parsing a long string of persian in python, and am opening it like this:
and using
but instead of printing out readable Persian, it outputs things like this in the terminal.
On the webpage, it outputs it fine.
What is the issue with it? Thank you
python - 在 Python 中将 unicode 类型对象写入文件
我正在尝试将 unicode 字符串写入 Python 中的文件,但是当我使用 linux“cat”或“less”读取文件时,没有写入正确的字符,而是显示为垃圾。
我正在从 Oracle 数据库中读取对象。当我打印类型时(其中 a 是数据库结果中的一行):
它输出:
我打开文件进行写入,如下所示:
我将这一行写入文件,如:
但是当我读取输出文件时,它没有显示正确的重音字符而是垃圾:
如何正确地将 unicode 字符串对象写入 Python 中的文件?
mysql - 识别编码和转换字符
每隔一段时间,来自中国的客户会在我的网站上下订单,有时他们的姓名和地址信息会以一系列我无法识别或翻译的字符写入 MySQL 数据库。
例如,最近一位客户的收货城市在我看来是这样的:
·s¥_¥«ªo¾ô°Ï
我可以肯定地说,数据库本身以及保存客户信息的字段都设置为 utf8_general_ci 排序规则。该网站本身曾经在其标题中包含以下内容类型声明:
但是最近几周这已经被评论了,我相信试图找出为什么一些中文订单信息是以这样的字符存储的。在它被注释掉之前,上面的相同信息将如下所示:
�s�_���o����
是否有一个在线实用程序可以用来将其中任何一种格式的文本块翻译成 DHL 或其他运输服务可以使用的可读内容?我怎样才能可靠地防止将来以这种方式存储信息?
python - 解开 mojibake
当您的字符解码不正确时,您如何识别原始字符串的可能候选者?
我知道这个图像文件名应该是一些日文字符。但是由于对 urllib 引用/取消引用、编码和解码 iso8859-1、utf8 的各种猜测,我无法解开并获得原始文件名。
腐败是可逆的吗?
xml - Munged 字符 - 来自 XML 的磅符号
我正在尝试从 XML 提要中提取 £ 符号(完整版在这里 > http://mjsiphone.com/scotjobsnet/)
迷你版在这里 > http://scotjobsnet.co.uk.ni.strategiesuk.net/testfeed.xml
我无法控制提要的来源或源服务器,也无法控制提要的格式、它们使用的标头等等。
我只需要构建一个 .NET 4.5 控制台应用程序,它将提取数据并将其保存在我们自己的站点数据库中。
此外,我必须删除所有 HTML(从职位描述中)并删除任何 HTML 编码字符并用它们的真实值替换它们。
因此,我需要在 MS SQL 2008 DB 中以 nvarchar 数据类型保存真正的 £ 符号,而不是 20,000 英镑或 20,000 英镑等。
查看提要的来源时,它的顶部有 UTF-8。
但是,在浏览器源中查看提要时,我没有看到将 UTF-8 作为请求/响应标头,在请求标头 (Chrome) 中我只看到:
接受语言:en-GB,en-US;q=0.8,en;q=0.6
当我将浏览器或控制台中的字符复制并粘贴到 SQL 中并检查它们时,它们返回 163,这是正确的 ASCII 字符编码,例如 £
如果您在浏览器中查看提要,英镑符号会显示得很好。
当我将内容输出到 Windows 命令控制台时,它们会显示为 £ 符号。
但是,当我尝试将它们保存到数据库或通过管道将控制台调试输出到 EditPlus 中的文件(字符编码设置为 UTF8 或 ASCII)时,我只是在数字前面得到正方形而不是在 CMD 中的符号
[.exe 的路径] > [debug.log 文件的路径]
控制台无法正确地将内容传递给编辑器,或者我需要使用正确的编码或传递更多标题或以不同方式提取 XML。
这是我用于测试的代码示例,仅使用一个在其中使用 £ 符号的字段,然后中断。
任何帮助都感激不尽。
我确定这只是我需要传递的标头,或者可能是将 XML 内容输出到编辑器的问题。
正如我在 Windows 控制台中查看输出之前所说,£ 显示良好。
谢谢
mysql - JSF2.0: Mojibake for primefaces4.0
Mojibake problem
[I use netbeans - jsf 2.2 - primefaces 4.0 - Mysql database]
I use Arabic in my JSF application and unfortunately the Arabic values sent to the server as other characters like this (بÙÙس Ùب ) (seen by debugger) and so stored in database like this.
the project work well at the beginning but after I do some other tasks in my project this problem occur but what cause the problem I do not know
the following solutions done but no effect
use the following line at every jsf page (.xhtml page)
use the following filter
and also I try my written filter
I use the form like this
Any one can help me
python - utf-8中字符的编码问题
我通过使用漂亮的汤库从网页获取链接a.get('href')
。在链接中有一个奇怪的字符®
,但当我得到它时®
。如何正确编码?我已经在页面开头添加了# -*- coding: utf-8 -*-
python - 如何在python中用前面的数字分割utf-8字符串?
我得到了一个原始的 utf-8 字符串:
我把它转换成字符串
我想将该数字 1 与其余字符串分开。
然后我尝试了:
不是我想的那样。
终于,我的脑海里闪过一丝火花,我做到了:
但问题是,我无法确保其他此类组合中的 utf-8 代码以 '\xe6' 开头,因此我需要一种方法来区分具有任意 utf-8 代码的数字,然后将它们分开。
有可能这样做吗?
python - Python Codecs 包无法解码字节
我正在使用 Python 2.7.3 和 BeuatofulSoup 从网站的表格中获取数据,然后使用codecs
将内容写入文件。我收集的变量之一,偶尔会出现乱码。例如,如果网站表看起来像这样
因此,当我生成City
变量时,我总是将其编码为utf-8
:
所以我创建的逗号分隔字符串列表的内容被称为RowData
并且RowHeaders
看起来像这样
然后我尝试使用以下代码将其写入文件
我收到以下错误
我可以使用 csv writer 包RowsData
,它工作正常。由于我不想进入的原因,我需要使用编解码器来输出 csv 文件。我不知道发生了什么。谁能帮我解决这个问题?提前致谢。