python - 使用 slate 时出现 unicodeDecodeError

Question

我有一些需要从中提取信息的 pdf。我在centos 7 上使用python 和python 的lib slate。一开始，slate 工作正常。但后来我必须更新几个模块和库。slate 库不再起作用。为了解决这个问题，我尝试更新 slate，并尝试使用不同的版本，但它们都不起作用。错误是：

File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`

当我取消我的代码时，一切正常。

我正在使用 slate 的一段代码：

def adequacaoCut(pdf, person, pathInt, pathImg):
    with open('pdfs/'+pdf, 'rb') as f:
        doc = slate.PDF(f)
        print doc
        ... rest of code that works fine

石板版本：0.5.2
python版本：2.7

随着时间的流逝，我不再记得 python、centos 或我所做的任何库或更新。我应该怎么办？

score 0 · Accepted Answer

我自己解决问题。我发现我的电脑中有两个 pdfminer（pdfminer 和 pdfminer.six）。我认为库之间存在某种冲突，或者 slate 试图调用 pdfminer.six 而不是 pdfminer。我卸载两者并仅重新安装 pdfminer。它现在就像一个魅力。

python - 使用 slate 时出现 unicodeDecodeError

1 回答 1

Related

Reference