问题标签 [python-unicode]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

1003 问题

0 投票

3 回答

6283 浏览

python - url开放编码

我有以下用于 urllib 和 BeautifulSoup 的代码：

结果：

当我尝试阅读该网站时，我得到：

python beautifulsoup python-unicode

2012-06-28T08:56:53.097

0 投票

2 回答

441 浏览

django - 在 Django 用户记录中存储 unicode first_name 和 last_name

试：

但是如果名字或姓氏是外国重音字母（unicode？）我会在用户记录中得到垃圾。

我能做些什么？

django django-models django-users python-unicode

2012-07-26T15:56:47.477

0 投票

3 回答

3984 浏览

python - Python3：仅在从 crontab 运行时出现 UnicodeEncodeError

第一篇文章，请善待，我已经搜索了很多，但我发现的大多数东西都与 Python 2 相关。

我有一个 Python3 脚本，它从文件列表构建一个 zip 文件；仅当从 crontab 运行脚本时，它才会因 UnicodeEncodeError 而失败，但从交互式控制台运行时它可以完美运行。我想环境中一定有什么东西，但我似乎无法弄清楚是什么。

这是代码摘录：

这是此代码片段的日志输出：

这是 crontab 行：

这是 runbackup.sh 的内容：

发生异常的文件总是相同的，但它似乎不包含任何非 ascii 字符：

操作系统是 Ubuntu Linux LTS 10.04，Python 版本 3.2（作为 altinstall 与其他 Python 版本并排安装）。所有 Python 源文件都有这个 shebang

作为第一行

你能帮我找出问题所在以及如何解决这个问题吗？

python python-3.x python-unicode

2012-07-31T07:38:13.440

0 投票

1 回答

1629 浏览

python - Python print unicode 不显示正确的符号

我正在使用 Ubuntu 12.04 LTS。当我在终端尝试这样的事情时：

符号显示正确。但是，如果尝试使用 python 2.7 打印 unicode 符号，我会得到：

正如 python 所示，我默认为终端使用 utf-8 编码：

python ubuntu python-unicode

2012-08-06T17:24:09.610

0 投票

6 回答

9576 浏览

python - String.maketrans 用于英语和波斯语数字

我有这样的功能：

我希望它将所有阿拉伯语和英语数字翻译成波斯语。但是 Python 说：

我尝试使用 Unicode 对字符串进行编码，utf-8但我总是遇到一些错误！有时问题是阿拉伯字符串！您知道这项工作的更好解决方案吗？

编辑：

问题似乎是 ASCII 中的 Unicode 字符长度。像“۱”这样的阿拉伯数字是两个字符——我用ord(). 长度问题从这里开始:-(

python python-2.7 python-unicode

2012-08-09T07:56:56.950

0 投票

1 回答

11192 浏览

python - UnicodeDecodeError：“ascii”编解码器无法解码位置 304 中 0xc3 中的字节：序数不在范围内（128）

我刚刚离开 PC 工作（使用 Python 2.7）并且有一个我刚刚完成的脚本（转载如下）。它在工作中运行良好，我只想添加一两件事。但我回到家，正在使用我的 Mac 版本的 Python（3.2.2），我收到以下错误：

我的代码在这里：

python macos syntax-error python-unicode

2012-08-10T22:08:46.867

0 投票

1 回答

692 浏览

python - 在 mongo 集合中保存微标志字符

我正在编写一个 python 脚本来创建一个基于 MySql 数据库的 mongo 集合。问题在于微标志字符：

我尝试使用不同的代码（utf-8、latin-1、cp1252、iso-8859-2）对值进行编码/解码但没有成功，但我总是收到以下错误：

这是从 mysql 数据库中获取数据的代码。数据库是 USDA 一个 0：

带有微符号字符的字段是 nutdef.Units 之一。

python unicode python-unicode

2012-08-17T23:26:54.553

0 投票

3 回答

847 浏览

python - 日本系统上的 Jython 'unknown enocoding ms932'

我在 Jython 2.5.1 中编写了一个程序，它在我的 Windows 7 机器上运行良好，但在日本机器上它抛出一个异常，说“未知编码'ms932'”

我发现codecs.java是唯一打印未知编码“xyz”消息的模块

此文件加载aliases.py确实包含

文件 cp932.py 包含

但是.. _codecs_jp 不存在，正如本页中所讨论的那样有没有人知道从这里去哪里？

http://web.archiveorange.com/archive/v/8tc1Zc2rV3qiUcy9zPlA

python unicode utf-8 jython python-unicode

2012-08-28T11:57:03.727

0 投票

2 回答

45063 浏览

python - Python：追溯 codecs.charmap_decode(input,self.errors,decoding_table)[0]

以下是示例代码，目的只是合并给定文件夹及其子文件夹中的文本文件。我偶尔会得到 Traceback，所以不知道在哪里看。还需要一些帮助来增强代码以防止合并空白行并在合并/主文件中不显示任何行。在合并文件之前，应该执行一些清理或者只是在合并过程中忽略空白行，这可能是个好主意。

文件夹中的文本文件不超过 1000 行，但聚合主文件很容易跨越 10000+ 行。

python file-io python-3.x traceback python-unicode

2012-08-31T10:04:56.917

0 投票

1 回答

339 浏览

python - Python 3：以二进制模式处理剥离线

在 SO 成员的帮助下，我能够达到以下目标，以下是示例代码，目的只是合并来自给文件夹及其子文件夹的文本文件并将输出存储为 master.txt。但我偶尔会得到回溯，看起来在读取文件时会引发错误。

考虑到建议、输入和一些研究，最好用统一的 unicode 清理文本文件或使用一些逐行函数，因此读取每一行应该修剪垃圾字符和空行。

回溯我得到：

python file-io python-3.x traceback python-unicode

2012-08-31T13:36:21.043

1 2 3 4 5 6 7 8 9 10