9

我正在尝试找出我们的 python 脚本崩溃的原因。

主要结构是这样的:

def main()
    try:
      dostuff
    except Exception as ex:
      import traceback
      tb = traceback.format_exc()
      import platform
      node = platform.node()
      sendMail([DEBUG_EMAIL], "Alarm exception on %s" % node, str(tb), [])

我在我们的主要错误处理中得到了这个堆栈跟踪,而不是在我应该得到的错误电子邮件中。

Traceback (most recent call last):
  File "/usr/lib/python2.6/logging/__init__.py", line 799, in emit
    stream.write(fs % msg.encode("UTF-8"))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 66: ordinal not in range(128)

从我看到的所有对 logger 的写调用都在 try 块内,但由于它没有在我的电子邮件发送异常块中被捕获和处理,所以我似乎错过了一些东西。我已经检查过了,sendMail 函数根本不使用日志记录模块。所以异常不应该起源于我的异常块。

我尝试添加

sys.tracebacklimit = 10

在文件的顶部查看异常的来源,但这并没有影响任何事情。现在我不知道如何找到问题的根源。

该脚本每小时运行一次,每周只崩溃一次,这让我认为它与输入数据有关,但这仅由 dostuff() 处理。

更新:

我已经弄清楚为什么我只得到一排堆栈跟踪。在 emit() 里面我发现了这个。

        try:
            ... doing stuff, something goes boom with encoding...
        except UnicodeError:
            stream.write(fs % msg.encode("UTF-8")) Here it goes Boom again
        self.flush()
    except (KeyboardInterrupt, SystemExit):
        raise
    except:
        self.handleError(record) Which means it ends up here

handleError 函数的相关部分如下所示:

 ei = sys.exc_info()
 try:
     traceback.print_exception(ei[0], ei[1], ei[2], None, sys.stderr)

仅打印堆栈跟踪的最后一部分。

4

1 回答 1

3

基本上你的问题是双重的

  1. 一个日志流不接受带有扩展字符的 8 位字符串,并抛出 UnicodeError
  2. 日志记录模块中有一个愚蠢的错误,使其丢失原始回溯

异常的确切原因是这样的:

>>> 'ä'.encode('UTF-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)

但这个例外并不是真正的问题。这是 2.6 日志记录代码的一部分;799 是该块的最后一行。最后一行是导致问题的行。基本上,有些东西以 8 位字节字符串记录消息,UTF-8 编码,包含 Latin-1 扩展字母;但流不喜欢这样,并在 try 块中抛出 UnicodeError;

try:
    if (isinstance(msg, unicode) and
        getattr(stream, 'encoding', None)):

        # .... the string is NOT an unicode instance, so ignored
        # for brevity
    else:
        # this line throws the original exception 
        # fs is a bytestring "%s\n", and msg is a bytestring
        # with extended letters, most probably Latin 1.
        # stream.write spits out an UnicodeError on these values
        stream.write(fs % msg)
except UnicodeError:
    # now we get a useless exception report from this code
    stream.write(fs % msg.encode("UTF-8"))

因此,要调试它,您需要在上述第 799 行设置断点,并尝试所有记录器(如果它们接受以下字符串):

logging.getLogger(name).critical('Testing logger: ä')

如果您点击第 799 行然后获取异常的回溯,它可以揭示正在发生的事情......

于 2013-08-20T14:26:46.747 回答