问题标签 [python-unicode]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - url开放编码
我有以下用于 urllib 和 BeautifulSoup 的代码:
结果:
当我尝试阅读该网站时,我得到:
django - 在 Django 用户记录中存储 unicode first_name 和 last_name
试:
但是如果名字或姓氏是外国重音字母(unicode?)我会在用户记录中得到垃圾。
我能做些什么?
python - Python3:仅在从 crontab 运行时出现 UnicodeEncodeError
第一篇文章,请善待,我已经搜索了很多,但我发现的大多数东西都与 Python 2 相关。
我有一个 Python3 脚本,它从文件列表构建一个 zip 文件;仅当从 crontab 运行脚本时,它才会因 UnicodeEncodeError 而失败,但从交互式控制台运行时它可以完美运行。我想环境中一定有什么东西,但我似乎无法弄清楚是什么。
这是代码摘录:
这是此代码片段的日志输出:
这是 crontab 行:
这是 runbackup.sh 的内容:
发生异常的文件总是相同的,但它似乎不包含任何非 ascii 字符:
操作系统是 Ubuntu Linux LTS 10.04,Python 版本 3.2(作为 altinstall 与其他 Python 版本并排安装)。所有 Python 源文件都有这个 shebang
作为第一行
你能帮我找出问题所在以及如何解决这个问题吗?
python - Python print unicode 不显示正确的符号
我正在使用 Ubuntu 12.04 LTS。当我在终端尝试这样的事情时:
符号显示正确。但是,如果尝试使用 python 2.7 打印 unicode 符号,我会得到:
正如 python 所示,我默认为终端使用 utf-8 编码:
python - String.maketrans 用于英语和波斯语数字
我有这样的功能:
我希望它将所有阿拉伯语和英语数字翻译成波斯语。但是 Python 说:
我尝试使用 Unicode 对字符串进行编码,utf-8
但我总是遇到一些错误!有时问题是阿拉伯字符串!您知道这项工作的更好解决方案吗?
编辑:
问题似乎是 ASCII 中的 Unicode 字符长度。像“۱”这样的阿拉伯数字是两个字符——我用ord()
. 长度问题从这里开始:-(
python - UnicodeDecodeError:“ascii”编解码器无法解码位置 304 中 0xc3 中的字节:序数不在范围内(128)
我刚刚离开 PC 工作(使用 Python 2.7)并且有一个我刚刚完成的脚本(转载如下)。它在工作中运行良好,我只想添加一两件事。但我回到家,正在使用我的 Mac 版本的 Python(3.2.2),我收到以下错误:
我的代码在这里:
python - 在 mongo 集合中保存微标志字符
我正在编写一个 python 脚本来创建一个基于 MySql 数据库的 mongo 集合。问题在于微标志字符:
我尝试使用不同的代码(utf-8、latin-1、cp1252、iso-8859-2)对值进行编码/解码但没有成功,但我总是收到以下错误:
这是从 mysql 数据库中获取数据的代码。数据库是 USDA 一个 0:
带有微符号字符的字段是 nutdef.Units 之一。
python - 日本系统上的 Jython 'unknown enocoding ms932'
我在 Jython 2.5.1 中编写了一个程序,它在我的 Windows 7 机器上运行良好,但在日本机器上它抛出一个异常,说“未知编码'ms932'”
我发现codecs.java是唯一打印未知编码“xyz”消息的模块
此文件加载aliases.py确实包含
文件 cp932.py 包含
但是.. _codecs_jp 不存在,正如本页中所讨论的那样 有没有人知道从这里去哪里?
python - Python:追溯 codecs.charmap_decode(input,self.errors,decoding_table)[0]
以下是示例代码,目的只是合并给定文件夹及其子文件夹中的文本文件。我偶尔会得到 Traceback,所以不知道在哪里看。还需要一些帮助来增强代码以防止合并空白行并在合并/主文件中不显示任何行。在合并文件之前,应该执行一些清理或者只是在合并过程中忽略空白行,这可能是个好主意。
文件夹中的文本文件不超过 1000 行,但聚合主文件很容易跨越 10000+ 行。
python - Python 3:以二进制模式处理剥离线
在 SO 成员的帮助下,我能够达到以下目标,以下是示例代码,目的只是合并来自给文件夹及其子文件夹的文本文件并将输出存储为 master.txt。但我偶尔会得到回溯,看起来在读取文件时会引发错误。
考虑到建议、输入和一些研究,最好用统一的 unicode 清理文本文件或使用一些逐行函数,因此读取每一行应该修剪垃圾字符和空行。
回溯我得到: