1

正如许多人所希望的那样,这个编码问题正在驱使我思考。我真的很感激对此有所了解!

最终目标是能够从终端和 cron 以及从 cron 和> stdout.txt. 不用说,我遇到了严重的编码问题。

因此,我的 script.py 从终端运行良好:python script.py
它会抛出一个错误,但是,当从终端运行时:python script.py > stdout.txt
它会在 cron 中运行时抛出相同的错误,无论哪种方式。

我有一个 python 脚本,crontab -e以 root 身份输入。

这是我的 script.py 标头:

#!/usr/bin/python
# -*- coding: utf-8 -*-

这是我的 cron 条目:

* * * * * python /home/ubuntu/parrot/script.py > /home/ubuntu/parrot/stdout.txt

这是我的 stdout.txt (相关部分):

Unexpected error!  (<type 'exceptions.UnicodeDecodeError'>, UnicodeDecodeError('ascii', 'blabla some weird text n\xc3\xa5r end', 54, 55, 'ordinal not in range(128)')) 

这是我来自终端的环境(相关部分):

LANG=en_US.UTF-8

这是我来自 cron 的环境(相关部分):

LANG=en_US.UTF-8

这是 script.py 中引发错误的(第一)行:

print 'Posting @%s: %s' % (statusObj.user.screen_name.encode('ascii', 'replace'), statusObj.text.encode('utf-8', 'replace'))

编辑: sys.getdefaultencoding()返回ascii

任何帮助是极大的赞赏!

4

1 回答 1

1

如果您可以控制,statusObj则应检查将数据解析到对象中的相关代码,并尝试使输入尽可能干净

您要确保在尝试对其进行编码之前将您的字符串解码为 un​​icode。

如果没有,您可以尝试:

# try to get the string into unicode
screen_name = unicode(statusObj.user.screen_name) 
post = unicode(statusObj.text) # probably an error here?
output_str = u"Posting @{name}: {post}".format(name=screen_name, post=post)
print output_str.encode("utf8", "replace") # encode the unicode string on 
于 2012-08-07T01:11:07.653 回答