pdf - slate3k WARNING:pdfminer.layout:Too many box (106) to group, skipping

翻译自：https://stackoverflow.com/questions/62858277 2020-07-12T07:25:01.133

397 次

我正在尝试从 python 中的 PDF 中提取文本，但我收到以下警告消息，它限制了提取的每个页面的文本量。有没有人能想到的解决方案来解决这个问题？代码也在下面：

警告：pdfminer.layout：要分组的框（106）太多，跳过。

import slate3k as slate

with open("mypdf.pdf",'rb') as f:
    extracted_text = slate.PDF(f)
print(extracted_text)

0 回答 0