问题标签 [character-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2292 浏览

ms-word - 当从 Word 复制/粘贴 'hello' 到 textarea 时,保存后变为 018hello 019

我有 Word 'hello',当我粘贴它时,我得到 018hello 019,所以撇号变成了这些奇怪的字符。

Web 应用程序的类型应该无关紧要,因为行为因我使用的工作站而异。

我用记事本、Excel 和写字板检查过,没有出现这个问题,仅适用于 Word。

它应该是 Word/IE 设置。

你知道是哪一个吗?

谢谢

0 投票
1 回答
456 浏览

c - converting character encoding using a posix c function

Is there a standard posix C function to convert encodings, say from windows-1251 to utf-8 and back?

0 投票
3 回答
11685 浏览

python - 是否有尝试猜测某些字节的字符编码的 Python 库函数?

我正在用 Python 编写一些邮件处理软件,在标头字段中遇到奇怪的字节。我怀疑这只是格式错误的邮件;消息本身声称是 us-ascii,所以我认为没有真正的编码,但我想在不抛出UnicodeDecodeError.

所以,我正在寻找一个函数,它需要 astr和可选的一些提示,并尽最大努力给我一个unicode. 我当然可以写一个,但如果存在这样的函数,它的作者可能已经更深入地考虑了解决这个问题的最佳方法。

我也知道 Python 的设计更喜欢显式而不是隐式,并且标准库旨在避免在解码文本时使用隐式魔法。我只想明确地说“继续猜测”。

0 投票
3 回答
11184 浏览

python - UTF-8 latin-1 转换问题,python django

好的,所以我的问题是我有字符串 '\222\222\223\225',它在数据库中存储为 latin-1。我从 django 得到的(通过打印它)是以下字符串,'ââââ¢' 我认为它是它的 UTF 转换。现在我需要将字符串传递给执行此操作的函数:

我收到此错误:

chr() arg 不在范围内 (256)

如果我首先尝试将字符串编码为 latin-1,则会收到此错误:

'latin-1' 编解码器无法对位置 0-3 中的字符进行编码:序数不在范围内(256)

我已经阅读了很多关于字符编码如何工作的内容,但我缺少一些东西,因为我只是不明白!

0 投票
21 回答
146350 浏览

php - PHP 输出显示带有问号的黑色小菱形

我正在编写一个从数据库源中提取的 php 程序。一些 varchars 的引号显示为带有问号的黑色菱形(�,REPLACEMENT CHARACTER,我假设来自 Microsoft Word 文本)。

如何使用 php 去除这些字符?

0 投票
2 回答
290 浏览

python - 信息似乎错误地从mysqldb出来,python django

在一个 latin-1 数据库中,我有“ \222\222\223\225”,当我尝试从 django 模型中提取这个字段时,我回来了u'\u2019\u2019\u201c\u2022'

所以我踏入其中并进入

/usr/local/python2.5/lib/python2.5/site-packages/MySQL_python-1.2.2-py2.5-linux-i686.egg/MySQLdb/cursors.py(327)fetchone()->(u '\u2019...1c\u2022',)

我不能更进一步,因为它是一个鸡蛋,但似乎 MySQL python 驱动程序将数据解释为 latin-1。

有人知道发生了什么吗?

0 投票
13 回答
92416 浏览

visual-studio - 将 Visual Studio 项目中的所有文件保存为 UTF-8

我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们都一样(带有签名的 UTF-8)。

我知道如何保存单个文件,但是项目中的所有文件呢?

0 投票
5 回答
34773 浏览

c++ - 如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?

如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?我的 VS2005 项目使用 Unicode 字符集,而 cpp 中的 sqlite 提供

用于打开文件夹。如何将字符串、CString 或 wstring 转换为 UTF-8 或 UTF-16 字符集?

非常感谢!

0 投票
1 回答
352 浏览

mysql - MySQL 排序规则没有像文档中宣传的那样工作

我试图让我的 MySQL 表在这个MySQL 参考页面的示例 2 中表现得像 utf8 表:

根据示例,这应该产生:

但我得到的只是简单的"Bär"。难道我做错了什么?我应该调整我的设置吗?

我在 Mac OS X 上的 MySQL 5.0.45 和 Red Hat 上的 5.0.51a 上试过这个。

编辑:我试过设置SET NAMES 'utf8',但这仍然给出相同的结果。这样做之后,我的变量是

0 投票
5 回答
76648 浏览

python - 如何在python中取消引用urlencoded unicode字符串?

我有一个像“Tanım”这样的unicode字符串,它以某种方式编码为“Tan%u0131m”。如何将此编码字符串转换回原始 unicode。显然 urllib.unquote 不支持 unicode。