0

我有一些需要从中提取信息的 pdf。我在centos 7 上使用python 和python 的lib slate。一开始,slate 工作正常。但后来我必须更新几个模块和库。slate 库不再起作用。为了解决这个问题,我尝试更新 slate,并尝试使用不同的版本,但它们都不起作用。错误是:

File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`

当我取消我的代码时,一切正常。

我正在使用 slate 的一段代码:

def adequacaoCut(pdf, person, pathInt, pathImg):
    with open('pdfs/'+pdf, 'rb') as f:
        doc = slate.PDF(f)
        print doc
        ... rest of code that works fine
  • 石板版本:0.5.2

  • python版本:2.7

随着时间的流逝,我不再记得 python、centos 或我所做的任何库或更新。我应该怎么办?

4

1 回答 1

0

我自己解决问题。我发现我的电脑中有两个 pdfminer(pdfminer 和 pdfminer.six)。我认为库之间存在某种冲突,或者 slate 试图调用 pdfminer.six 而不是 pdfminer。我卸载两者并仅重新安装 pdfminer。它现在就像一个魅力。

于 2019-01-24T11:51:46.650 回答