我在 PDF 中有以下文本:
STUDENT ________JOHN______
DATE ______MM/DD/AAA______ (date)
COURSE ___________________ PROFESSOR ___________
当我使用 PDFMiner 提取文本时,我得到以下信息:
STUDENT ____
DATE MM/DD/AAA
(date)
JOHN
COURSE
___________________
PROFESSOR
___________
如何使用 PDFMiner(或其他 Python 库)获得正确的输出?