0

我想使用 PDFMiner 3k,我在 windows 上使用 python 3.3.3,我不知道要写什么指令来使用 PFDMiner 3k,我尝试了很多代码,但仍然不起作用,其中一些是对于 PDFMiner (python 2.7),例如我尝试了下一个代码:

import nltk

from io import StringIO

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter

from pdfminer.converter import TextConverter

from pdfminer.layout import LAParams

from pdfminer.pdfpage import PDFPage

请注意,我已将脚本文件放在包含 PDFMiner 3k 目录的目录中。后者被命名为pdfminer。

我得到下一个错误:

 ImportError: No module named 'pdfminer.pdfminer'; pdfminer is not a package

有什么建议吗?,我需要帮助。

4

1 回答 1

1

很难说,但听起来你的问题是你没有安装 PDFMiner3k,你只是将它解压缩到与数据相同的目录中。

不要那样做。一些包以这种方式工作,但大多数不是。

此外,还PDFMiner3k需要一些 Python 不附带的包,例如ply. 如果你没有它们,它就行不通。

安装软件包的正确方法几乎总是使用pip.

实际上,您甚至不必下载它;just pip install PDFMiner3k,并且pip会搜索最新版本,以及它需要的所有东西的最新版本,并为你安装它们。


当然,如果你想工作,你还需要安装 NLTK nltk。但是你可能会猜到这个命令。

有些包需要 C 编译器来构建。虽然其中大多数应该有二进制轮子所以pip install spam仍然有效,但有些软件包并不完全是最新的。因此,如果您遇到有关编译器或 vcvarsall 或类似的错误,请查看Christoph Gohlke 的网站;他有轮子用于不自己制造的包裹。

于 2015-04-20T09:37:32.403 回答