8

第一篇文章,请善待,我已经搜索了很多,但我发现的大多数东西都与 Python 2 相关。

我有一个 Python3 脚本,它从文件列表构建一个 zip 文件;仅当从 crontab 运行脚本时,它才会因 UnicodeEncodeError 而失败,但从交互式控制台运行时它可以完美运行。我想环境中一定有什么东西,但我似乎无法弄清楚是什么。

这是代码摘录:

def zipFileList(self, rootfolder, filelist, zip_file, logger):
    count = 0

    logger.info("Generazione file zip {0}: da {1} files".format(zip_file, len(filelist)))
    zip = zipfile.ZipFile(zip_file, "w", compression=zipfile.ZIP_DEFLATED)

    for curfile in filelist:
        zip.write(os.path.join(rootfolder, curfile), curfile, zipfile.ZIP_DEFLATED)
        count = count + 1

    zip.close()
    logger.info("Scrittura terminata: {0} files".format(count))

这是此代码片段的日志输出:

2012-07-31 09:10:03,033: root - ERROR - Traceback (most recent call last):
  File "/usr/local/lib/python3.2/zipfile.py", line 365, in _encodeFilenameFlags
  return self.filename.encode('ascii'), self.flag_bits
UnicodeEncodeError: 'ascii' codec can't encode characters in position 56-57: ordinal not in range(128)

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "XBE.py", line 45, in main
    pam.executeList(logger)
  File "/home/vte/vtebackup/vte41/scripts/ptActivityManager.py", line 62, in executeList
    self.executeActivity(act, logger)
  File "/home/vte/vtebackup/vte41/scripts/ptActivityManager.py", line 71, in executeActivity
    self.exAct_FileBackup(act, logger)
  File "/home/vte/vtebackup/vte41/scripts/ptActivityManager.py", line 112, in exAct_FileBackup
    ptfs.zipFileList(srcfolder, filelist, arcfilename, logger)
  File "/home/vte/vtebackup/vte41/scripts/ptFileManager.py", line 143, in zipFileList
    zip.write(os.path.join(rootfolder, curfile), curfile, zipfile.ZIP_DEFLATED)
  File "/usr/local/lib/python3.2/zipfile.py", line 1115, in write
    self.fp.write(zinfo.FileHeader())
  File "/usr/local/lib/python3.2/zipfile.py", line 355, in FileHeader
    filename, flag_bits = self._encodeFilenameFlags()
  File "/usr/local/lib/python3.2/zipfile.py", line 367, in _encodeFilenameFlags
    return self.filename.encode('utf-8'), self.flag_bits | 0x800
UnicodeEncodeError: 'utf-8' codec can't encode character '\udcc3' in position 56: surrogates not allowed

这是 crontab 行:

10 9 * * * /home/vte/vtebackup/vte41/scripts/runbackup.sh >/dev/null 2>&1

这是 runbackup.sh 的内容:

#! /bin/bash -l

cd /home/vte/vtebackup/vte41/scripts

/usr/local/bin/python3.2 XBE.py

发生异常的文件总是相同的,但它似乎不包含任何非 ascii 字符:

/var/vhosts/vte41/http_docs/vtecrm41/storage/2012/July/week4/169933_Puccini_Gabriele.tif

操作系统是 Ubuntu Linux LTS 10.04,Python 版本 3.2(作为 altinstall 与其他 Python 版本并排安装)。所有 Python 源文件都有这个 shebang

#!/usr/bin/env python3.2

作为第一行

你能帮我找出问题所在以及如何解决这个问题吗?

4

3 回答 3

21

一位团队成员在Python 错误线程中找到了解决方案。

该问题已通过在脚本命令前添加 LANG 指令得到解决:

* * * * * LANG=it_IT.UTF-8 /home/vte/vtebackup/vte41/scripts/runbackup.sh >/dev/null 2>&1

我希望这对其他人有用,因为我让自己在这方面摸不着头脑:)

于 2012-07-31T08:03:32.040 回答
8

检查您的语言环境。在交互式控制台上,运行命令locale。这是我得到的:

LANG=
LC_COLLATE="en_US.UTF-8"
LC_CTYPE="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_ALL="en_US.UTF-8"

Python 根据环境变量LC_CTYPELANG环境变量确定如何解释文件名,我强烈怀疑其中一个在您的 cron 环境中设置为不同的编码。

如果是这种情况,您的文件名将使用不同的编码解码为 un​​icode,然后导致文件名无法编码为 UTF-8 或 ASCII。

只需LC_CTYPE在您的 cron 定义中设置变量,或者在时间条目之前的一行上,或者作为要执行的命令的一部分:

LC_CTYPE="en_US.UTF-8"
* * * * * yourscriptcommand.py

与 python Unicode 问题一样,答案在于Unicode HOWTO,文件名部分

于 2012-07-31T08:04:12.613 回答
2

中国人

export LANG="zh_CN.utf-8"                                                                            
export LC_CTYPE="zh_CN.utf-8"                                                                        
export PYTHONIOENCODING="utf-8"                                                                      

/export/zhangys/python3.5.2/bin/python3 diff_reporter.py > /home/admin/diff_script/cron_job.log 2>&1 
于 2016-10-14T06:35:51.683 回答