1

我有一个旧的 Linux 版本 (0.12.4)pdftotext运行没有问题,但我想在 Windows 7 机器上运行它。

xpdf-2.03-bin.exe我从http://gnuwin32.sourceforge.net/packages/xpdf.htm下载了似乎是最新版本的 Windows 安装程序。

我接受了所有安装程序的默认设置。当我在 Linux 版本正确处理的 PDF 文件上运行 Windows 7pdftotext时,我收到以下一系列错误消息:

 - Error <0>: PDF file is damaged - attempting to reconstruct xref table ...
 - Error: Couldn't find trailer dictionary
 - List item Error: Couldn't read xref table

我对这些错误消息进行了网络搜索,但我发现与这些错误相关的问题似乎都与我遇到的问题无关。

有没有人在 Windows 7 上遇到过这个问题pdftotext或知道如何解决?

4

1 回答 1

1

从版本号猜测:

  • 0.12.4在 Linux 上
  • 2.03在 Windows 上

您似乎正在使用两种截然不同的野兽,它们都包含一个名为的实用程序pdftotext

  • Version0.12.4是2010 年 2 月发布的基于Poppler的版本。pdftotext到现在快 5 岁了,今天已经过时了。Poppler 是XPDF 原始代码库的“分支”  ,发生在 2005 年。自分支发生以来,它的开发速度比“母亲”代码更快,并且获得了更多附加 + 有用的功能。但是,很难找到适用于 Windows 的预编译二进制文件。最新版本是 0.30.0(2015 年 1 月)。

  • Version2.03是2003 年 10 月发布的基于XPDF的版本pdftotext。现在已经 11 多年了,它是古老的. XPDF 是提供该pdftotext实用程序的原始软件。它于 1995 年首次发布。它仍在开发中,尽管比 Poppler 前叉要慢。它的最新版本是 3.04 版(2014 年 5 月),可以在此处下载。注意——您可能会很感兴趣:此版本包含一个新的文本提取器!

于 2015-01-13T19:31:23.603 回答