问题标签 [poppler-utils]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4386 浏览

jpeg - 为什么 pdftoppm poppler-utils 没有 jpeg 选项?

在 Ubuntu 10.04 上,我安装了 poppler-utils 包以便能够运行 pdftoppm。

我的目标是将 PDF 转换为 jpeg,但是我没有该选项/标志可用。我似乎拥有的唯一光栅化器是 PNG 支持。

有人可以告诉我如何获得 jpeg 支持吗?非常感谢。

(运行后请参阅下面的选项列表:pdftoppm --help):

0 投票
2 回答
597 浏览

poppler - 如何在 poppler 中配置字体替换

将 pdf 页面转换为图像时,如果输入 pdf 中未嵌入字体,则使用默认字体替换(通常为 Arial)。但是,我想更改默认字体。

这里有描述,但信息太少。我不知道如何创建以及将配置文件放在哪里。

操作系统:Ubuntu 18.04

0 投票
1 回答
396 浏览

azure - AZURE 函数:PDFInfoNotInstalledError:无法获取页数。poppler 是否已安装并在 PATH 中?对于 pdf2image

我收到此错误“结果:失败异常:PDFInfoNotInstalledError:无法获取页数。是否已安装 poppler 并在 PATH 中?用于 azure 函数。”

我正在使用 pdf2image 库的 convert_from_path() 将我的 pdf 处理为图像。当我从本地测试时,这很好用。在将函数发布到 azure 时,poppler-utils 包也安装在那里,但仍然出现错误。我看到了很多与此错误相关的线程并尝试了它,但想知道是否有人专门针对 azure 函数体验过这个问题。

0 投票
1 回答
415 浏览

python - heroku poppler buildpack 错误“libpng12.so.0:无法打开共享对象文件:没有这样的文件或目录”

我正在尝试使用 pdf2image 库,特别是 convert_from_bytes 方法来使用 pytesseract 将 pdf 转换为 txt 文件。我的应用程序在本地运行,但我想将应用程序部署到 heroku。我尝试将 python-poppler 添加到我的 pipfile 中,但在部署过程中无法下载。我一直在尝试使用 buildpack https://github.com/survantjames/heroku-buildpack-poppler.git,但是当我尝试使用该应用程序时,我在日志中收到此错误。

我该怎么做才能在 heroku 上安装 poppler 并在我的应用程序中工作?谢谢!

0 投票
3 回答
439 浏览

amazon-web-services - 如何编译准备为 Amazon Linux 部署最新版本的“poppler-utils”

我有一台在 AWS Linux 上运行的服务器。该应用程序使用poppler-utils

服务器是 CI 集成的。因此,在部署应用程序之前安装了所有必要的依赖项。依赖项之一是poppler-utils.

到目前为止,我一直在使用$ yum install poppler-utils. 最近我意识到 Amazon Linux repo 上的版本已经很久没有更新了(0.26.5 与 ubuntu 上的最新版本是 20.08 - 6 年的版本差异)。

我当然可以在单台机器上构建和安装(使用源代码)makemake install出于 CI/CD 的目的,我需要一些可以快速安装和部署的东西(yum 包非常适合这个)。

如何准备好部署最新版本的 poppler-utils?

我探索的几个想法:

  1. 尝试从另一个具有最新版本 poppler-utils 的 repo(非 amazon linux)安装。
  2. 自己构建一个 rpm 文件。从来没有自己建造过,所以这项任务看起来很艰巨。

寻找某个方向,走哪条路。

0 投票
0 回答
20 浏览

docker - 如何拥有多个版本的pdfinfo?

我有几个使用 pdfinfo 和 pdftotext 对 PDF 文件执行操作的脚本。但是,只有其中一个需要调用pdfinfo -dests. 其他脚本使用的Poppler版本没有 dest,但不是更新所有 Poppler 实用程序,我想从/usr. 可能吗?

我正在使用python:3.7-slim-stretch基于 debian 的 . 我试图遵循这个帖子的答案,但我只是没有utils/.libs/在 Poppler 目录中找到。

我的 dockerfile 的一部分:

0 投票
0 回答
160 浏览

python - 无法获取页数。poppler 是否已安装并在 PATH 中?

我一直试图让这部分代码执行,但错误不断弹出。我已经将 poppler 添加到 evn 路径。还有什么我可以做的吗?

代码:

0 投票
0 回答
44 浏览

python - Python的Pdf2image库抛出“显示/空间中没有字体”错误

对于一些 pdf,pdf2image 库会引发此错误。我已经设置strict=True了 convert_from_path 方法,因此我收到了这些语法错误

我认为这意味着我的系统没有所需的字体,但有没有其他方法可以解决这个问题?

我相信这实际上是一个poppler问题,但我无法找到任何东西。

这是代码片段:

这是错误:“语法错误(1077):显示/空间中没有字体语法错误(1117):显示/空间中没有字体语法错误:未知字体标签'F5'”

0 投票
1 回答
64 浏览

python - 在 Lambda 的 AWS 基础 python 映像中安装 poppler

我正在尝试在 AWS Lambda 上部署我的 docker 容器。但是,我pdf2image在代码中使用包,它依赖于poppler. 要安装poppler,我需要在 Dockerfile 中插入以下行。

这是 dockerfile 的完整视图。

但是,要在 Lambda 上部署,我需要为 Lambda 使用 AWS 基础 python 映像。这是我尝试重写上述 dockerfile 以使用 Lambda 基础映像。

根据上面的dockerfile可以看到apt-get命令无法运行。可以理解,因为它不像我之前所做的那样来自 ubuntu 图像。我的问题是,如何poppler在 Lambda 基础映像中安装?