问题标签 [character-encoding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ms-word - 当从 Word 复制/粘贴 'hello' 到 textarea 时,保存后变为 018hello 019
我有 Word 'hello',当我粘贴它时,我得到 018hello 019,所以撇号变成了这些奇怪的字符。
Web 应用程序的类型应该无关紧要,因为行为因我使用的工作站而异。
我用记事本、Excel 和写字板检查过,没有出现这个问题,仅适用于 Word。
它应该是 Word/IE 设置。
你知道是哪一个吗?
谢谢
c - converting character encoding using a posix c function
Is there a standard posix C function to convert encodings, say from windows-1251 to utf-8 and back?
python - 是否有尝试猜测某些字节的字符编码的 Python 库函数?
我正在用 Python 编写一些邮件处理软件,在标头字段中遇到奇怪的字节。我怀疑这只是格式错误的邮件;消息本身声称是 us-ascii,所以我认为没有真正的编码,但我想在不抛出UnicodeDecodeError
.
所以,我正在寻找一个函数,它需要 astr
和可选的一些提示,并尽最大努力给我一个unicode
. 我当然可以写一个,但如果存在这样的函数,它的作者可能已经更深入地考虑了解决这个问题的最佳方法。
我也知道 Python 的设计更喜欢显式而不是隐式,并且标准库旨在避免在解码文本时使用隐式魔法。我只想明确地说“继续猜测”。
python - UTF-8 latin-1 转换问题,python django
好的,所以我的问题是我有字符串 '\222\222\223\225',它在数据库中存储为 latin-1。我从 django 得到的(通过打印它)是以下字符串,'ââââ¢' 我认为它是它的 UTF 转换。现在我需要将字符串传递给执行此操作的函数:
我收到此错误:
chr() arg 不在范围内 (256)
如果我首先尝试将字符串编码为 latin-1,则会收到此错误:
'latin-1' 编解码器无法对位置 0-3 中的字符进行编码:序数不在范围内(256)
我已经阅读了很多关于字符编码如何工作的内容,但我缺少一些东西,因为我只是不明白!
php - PHP 输出显示带有问号的黑色小菱形
我正在编写一个从数据库源中提取的 php 程序。一些 varchars 的引号显示为带有问号的黑色菱形(�,REPLACEMENT CHARACTER,我假设来自 Microsoft Word 文本)。
如何使用 php 去除这些字符?
python - 信息似乎错误地从mysqldb出来,python django
在一个 latin-1 数据库中,我有“ \222\222\223\225
”,当我尝试从 django 模型中提取这个字段时,我回来了u'\u2019\u2019\u201c\u2022'
。
所以我踏入其中并进入
/usr/local/python2.5/lib/python2.5/site-packages/MySQL_python-1.2.2-py2.5-linux-i686.egg/MySQLdb/cursors.py(327)fetchone()->(u '\u2019...1c\u2022',)
我不能更进一步,因为它是一个鸡蛋,但似乎 MySQL python 驱动程序将数据解释为 latin-1。
有人知道发生了什么吗?
visual-studio - 将 Visual Studio 项目中的所有文件保存为 UTF-8
我想知道是否可以将 Visual Studio 2008 项目中的所有文件保存为特定的字符编码。我得到了一个混合编码的解决方案,我想让它们都一样(带有签名的 UTF-8)。
我知道如何保存单个文件,但是项目中的所有文件呢?
c++ - 如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?
如何将 Unicode 字符串转换为 utf-8 或 utf-16 字符串?我的 VS2005 项目使用 Unicode 字符集,而 cpp 中的 sqlite 提供
用于打开文件夹。如何将字符串、CString 或 wstring 转换为 UTF-8 或 UTF-16 字符集?
非常感谢!
mysql - MySQL 排序规则没有像文档中宣传的那样工作
我试图让我的 MySQL 表在这个MySQL 参考页面的示例 2 中表现得像 utf8 表:
根据示例,这应该产生:
但我得到的只是简单的"Bär"
。难道我做错了什么?我应该调整我的设置吗?
我在 Mac OS X 上的 MySQL 5.0.45 和 Red Hat 上的 5.0.51a 上试过这个。
编辑:我试过设置SET NAMES 'utf8'
,但这仍然给出相同的结果。这样做之后,我的变量是
python - 如何在python中取消引用urlencoded unicode字符串?
我有一个像“Tanım”这样的unicode字符串,它以某种方式编码为“Tan%u0131m”。如何将此编码字符串转换回原始 unicode。显然 urllib.unquote 不支持 unicode。