ScraperWiki的最新版本依赖于Poppler(或者 GitHub 是这么说的)。不幸的是,它只指定了如何在 macOS 和 Linux 上获取它,而不是 Windows。
快速谷歌搜索没有什么太有希望的。有谁知道如何在 Windows 上为 ScraperWiki 获取 Poppler?
ScraperWiki的最新版本依赖于Poppler(或者 GitHub 是这么说的)。不幸的是,它只指定了如何在 macOS 和 Linux 上获取它,而不是 Windows。
快速谷歌搜索没有什么太有希望的。有谁知道如何在 Windows 上为 ScraperWiki 获取 Poppler?
其他答案已链接到 Windows 用户的正确下载页面,但未指定如何为外行安装它们。
转到此页面并下载您选择的二进制文件。在本例中,我们将下载并使用poppler-0.68.0_x86
.
将存档文件解压缩poppler-0.68.0_x86.7z
到C:\Program Files
. 因此,目录结构应如下所示:
C:
└ Program Files
└ poppler-0.68.0_x86
└ bin
└ include
└ lib
└ share
通过执行以下操作添加C:\Program Files\poppler-0.68.0_x86\bin
到您的系统PATH
:单击 Windows 开始按钮,搜索Edit the system environment variables
,单击Environment Variables...
,在 下System variables
,查找并双击PATH
,单击New
,然后添加C:\Users\Program Files\poppler-0.68.0_x86\bin
,单击OK
。
如果您使用终端来执行 poppler(例如pdf2image
在命令行中运行),您可能需要重新打开终端才能使 poppler 工作。
完毕!
Poppler Windows 二进制文件可从ftp://ftp.gnome.org/Public/GNOME/binaries/win32/dependencies/获得——但请注意,这些文件并不是最新的。
如果您正在寻找 Python (2.7) 绑定(正如这个问题的标签所暗示的那样),我过去曾通过此错误报告请求它们。有几个人显然设法生产了一些东西,但我还没有检查过那些。
至于最近的(python 绑定无关)poppler Windows 二进制文件 Google 结果,请参阅http://blog.alivate.com.au/poppler-windows/
最后,还有全新的(并且当前非常频繁更新的)PyGObject 一体化安装程序(主要旨在为 Windows 提供 PyGObject 内省的 Gtk+3 Python 绑定等),所以如果您正在寻找,转到http://sourceforge.net/projects/pygobjectwin32/files/?source=navbar
在 Windows 上安装 anaconda 后,可以简单地执行:
conda install -c conda-forge poppler
https://github.com/oschwartz10612/poppler-windows/releases
我将最新的 Poppler 预构建二进制文件与 Windows 的依赖项打包在一起快速存储库。在 conda-forge 和poppler- feedstock 的帮助下构建。包括最新的 poppler 数据。
更新 2
更新 1
本站不再维护。Poppler 0.68 版今天已经过时了。您还可以在此处找到为 Windows 编译的最新版本:https ://anaconda.org/conda-forge/poppler/files遗憾的是没有 32 位版本,只有 64 位
…但是这个包不包含依赖项:
似乎 Anaconda 人有一个工具来下载一个包和所有依赖项。TAR 包中有一个文件:index.json,其中列出了它所依赖的包。我一个一个下载了依赖项,是的:这很痛苦。
原始答案
最新的 Poppler Windows 二进制文件可以在这里找到:
您应该考虑使用Windows Subsystem for Linux (WSL)。
在 Ubuntu 命令行中,运行以下命令:
sudo apt-get update
sudo apt-get upgrade
sudo apt install poppler-utils
pdftocairo -v
- 检查安装的版本然后,您可以通过两种方式运行 pdftocairo(例如):
pdftocairo ...
wsl pdftocairo...
注意:每个 Ubuntu 版本都有一个默认版本的 poppler。您需要查看说明(互联网上应该有很多),以了解如何在 Ubuntu 上安装最新版本的 poppler-utils。这可能涉及相当多的步骤,这些步骤将从源代码编译。例如,像这样的https://askubuntu.com/a/722955。然后你可能会遇到很多问题。
最新版本的 Ubuntu 19.04,可以安装 Poppler 74。但是 Ubuntu 18.04 似乎是你现在可以为 WSL 安装的最新版本,它安装了 Poppler 62。
要在 Windows 上简单地安装 Poppler,请执行以下提到的步骤,而无需接触环境变量。
现在转到您要调用 Poppler 进行图像转换的 Python 代码,并使用下面提到的代码片段:
from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:\User\Poppler\poppler-0.68.0_x86\poppler-0.68.0\bin')
for page in pages:
page.save('out.jpg', 'JPEG')
Poppler 可作为Chocolatey 包使用:
choco install poppler
默认情况下,Poppler 已安装C:\ProgramData\chocolatey\lib\poppler
并为以下工具自动创建垫片:pdfdetach
, pdffonts
, pdfimages
, pdfinfo
, pdfseparate
, pdftocairo
, pdftohtml
, pdftoppm
, pdftops
, pdftotext
, pdfunite
。
要更新 Poppler,请运行:
cup poppler
从主桶安装:
scoop install poppler
默认情况下,Poppler 已安装~\scoop\apps\poppler
并为以下工具自动创建垫片:pdfdetach
, pdffonts
, pdfimages
, pdfinfo
, pdfseparate
, pdftocairo
, pdftohtml
, pdftoppm
, pdftops
, pdftotext
, pdfunite
。
要更新 Poppler,请运行:
scoop update poppler
正如另一个答案中提到的,MiKTeX目前附带了 Poppler 工具,另一个 LaTeX 发行版 TeX Live 也是如此。从指南:
命令行工具。
许多常见的 Unix 命令行程序的 Windows 端口与通常的 TeX Live 二进制文件一起安装。这些包括
gzip
,zip
,unzip
和 poppler 套件中的实用程序 (pdfinfo
,pdffonts
, ...)
Poppler 套件默认位于C:\texlive\<year>\bin\win32
,如果您可以编译您的 LaTeX 文档,则应该开箱即用,因为此位置已由安装程序添加到 PATH。
看起来可以在此处找到可使用 Visual Studio 构建的版本 https://bitbucket.org/merarischroeder/poppler-for-windows/overview
可在此处找到适用于 Windows x64、Mac OSX-64、Linux-64 位的最新二进制文件
https://anaconda.org/conda-forge/poppler/files
在撰写本文时,Poppler 版本 0.84 可在链接中获得,这是非常最新的。接受的答案和 Alexey 给出的链接不再指向当前版本的 poppler
更新:截至 2021 年 3 月 8 日,最佳答案是由 Owen Schwarz 以上https://stackoverflow.com/a/62615998/590388
另一种选择是,如果您已经安装了 MikTeX,那么 poppler 默认包含在内,并且可能已经在您的PATH
. 在我的情况下,二进制文件安装在:C:\Program Files\MiKTeX 2.9\miktex\bin\x64
安装 Microsoft Visual C++ 构建工具
通过 conda 提示符 conda 安装 poppler:
conda install -c conda-forge poppler
请注意:如果您没有安装 anaconda,可以从这里下载, https://docs.anaconda.com/anaconda/install/windows/
这就是我所做的。
安装msys2
打开 msys2 shell 然后运行:
吃豆人-Syu
pacman -S mingw-w64-x86_64-poppler
打开 MingW64 Shell 并访问 poppler 二进制文件
二进制文件安装在:C:\msys64\mingw64\bin