我正在开发一系列解析器,从我的单元测试中得到一堆回溯,例如:
File "c:\Python31\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 112: character maps to <undefined>
这些文件是用 open() 打开的,没有额外的争论。我可以将额外的参数传递给 open() 或使用编解码器模块中的某些东西以不同的方式打开这些参数吗?
这提出了用 Python 2 编写并使用 2to3 工具转换为 3 的代码。
更新:事实证明这是将 zipfile 输入解析器的结果。单元测试实际上预计会发生这种情况。解析器应该将其识别为无法解析的东西。所以,我需要改变我的异常处理。现在正在这样做的过程中。