问题标签 [poppler]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4997 浏览

linux - 加载共享库时出错:libpoppler.so.58:无法打开共享对象文件

我按照说明编译并安装了 poppler-0.39.0。默认情况下,头文件进入 int\usr\local\include并且 lib 文件进入\usr\local\lib. pdftohtml 安装在\usr\local\bin.

现在,当我尝试运行时pdftohtml,它会出现以下错误。

虽然libpoppler.so.58存在于\usr\local\lib. 请帮我。

0 投票
1 回答
238 浏览

c++ - c++ qt libpoppler 多线程问题

使用 libpoppler-qt5.so。我使用以下代码从 PDF 文档中提取文本:

但是当它用于多个线程时会出现段错误。对于一个线程,它似乎没问题。这个代码线程安全吗?是否有任何其他线程安全库可以从 PDF 文档中提取文本?谢谢你

0 投票
0 回答
361 浏览

php - PHP Poppler 实现失败

除了将文件转换Poppler为. 我通过安装该库,不幸的是,除了一些有关安装的指南外,没有可用的文档,但仍然不完整。PDFHTMLcomposer

鉴于此Main API usage

我什至无法定义应该给出哪些参数$file = new Poppler\Process\PdfFile(...);

我试过的:

这给出了一个错误:

这是 PdfFile.php:

0 投票
0 回答
152 浏览

php - 在 PHP 中使用 exec() 安装 poppler

我对使用Linux命令很陌生。我正在尝试安装Poppler-Utils使用LinuxPHP代码:

输出:

  • 这是什么意思?
  • Poppler-Utils它是在 Linux 服务器上安装的正确方法吗?

任何帮助表示赞赏!

0 投票
1 回答
1274 浏览

pdf - 如何将带有“pdftocairo -eps”的“横向”PDF转换为正确的EPS?

我不知道如何使用该工具将带有单张图片的“横向”PDF 文件(例如,paperwidth=842 和 paperheight=595 点以及填充整个页面的图像)pdftocairo转换为 EPS 文件。

我得到的输出要么是原始文件的缩小版本(宽度从 842 缩放到 595 以适应 EPS 文件的“不正确”页宽 595),要么是 595 和 842 之间的内容被截断的 EPS(与-noshrink参数)。

有任何想法吗?

编辑1:pdftocairo version 0.43.0

输入PDF: pdfinfo test.pdf Creator: DocType PDF-Emitter (DocType PDF-Emitter v1.9.37-9-g1b2b6f3) Producer: Haru Free PDF Library 2.3.0RC2 CreationDate: Mon Jun 4 11:18:30 2018 Tagged: no UserProperties: no Suspects: no Form: none JavaScript: no Pages: 1 Encrypted: no Page size: 595.44 x 841.68 pts Page rot: 90 File size: 149246 bytes Optimized: no PDF version: 1.3

横向 PDF

用 pdftocairo -eps test.pdf 转换

景观 EPS

0 投票
0 回答
1140 浏览

python - Losing information when extracting text from PDF using PDFMiner

I'm using Python 3.4 on Windows 7 and hoping I can extract text from PDF files using PDFMiner. However, losing information was quite common when I was testing. For some files, it may be just a matter of a few sentences. But I've encountered situations where half of the text could not be extracted, depending on the file format. Here's my full code:

I wonder if there's a way to extract the full text using PDFMiner. I've heard of poppler, but I can't seem to find how to use it as a Python library. Besides, I don't want to use the command line. Can anyone help?

Here's an example: a thesis. Several paragraphs were lost when extracting using the code above. Like in the 2nd page, I could only extract first half of the page until "Pereira, Tishby, and Lee (1993)" at the middle. Then it just skip right to the next page for no apparent reason.

0 投票
1 回答
385 浏览

cairo - 我应该什么时候使用 poppler_page_render 和 poppler_page_render_for_printing?

有两个函数可以在 cairo 表面上呈现 PopplerPage:poppler_page_renderpoppler_page_render_for_printing. 该文档指出,后者应该用于“渲染将要打印的页面”。

我的问题是:如果以后将我的 cairo 表面保存为 (pdf) 文件,我应该使用其中哪一个?另存为文件是否构成poppler“打印”?我将不胜感激参考文档。PopplerPage 是由 pdf 文件创建的poppler_document_get_page吗?

0 投票
0 回答
1576 浏览

qt - 如何在窗口上将 poppler 0.45 编译为 Qt5.5.1 的 DLL

我想在窗口上为 Qt5.5.1 构建 poppler0.45 版本的 DLL。我按照http://www.seppemagiels.com/blog/building-poppler-windows-using-mingw上的指南进行操作,但没有成功。我使用 CMake 工具编译库。下面的错误: 在此处输入图像描述

如何正确配置值?或者如果已经存在 poppler 0.45 的 DLL,请与我分享。

0 投票
1 回答
269 浏览

pdf - PDF 优化:pdftops -passfonts - 它如何使 PDF 加载速度更快?

几周前,我们的用户指出一些大型 OCRed PDF(ABBYY 生成)加载速度非常慢,并要求我们对其进行一些优化。

经过一番调查,问题似乎是由 PDF 中嵌入的复杂文本引起的。我尝试了不同的脚本来优化 PDF,例如 ghostscript、qpdf 等...

我发现的唯一一个显着改进是使用带有 -passfonts 选项的 pdftops(来自 poppler)并使用 ghostscript ps2pdf 将其转换回 PDF: pdftops -passfonts intput.pdf output.ps && ps2pdf output.ps output.pdf .

但是,问题是我不知道 -passfonts 如何使 PDF 加载更快,以及它是否会产生我不知道的副作用......

那么 PDF 专家能否阐明这种优化背后的原因/逻辑?

谢谢大家!!杰弗里

0 投票
1 回答
1224 浏览

python-3.x - python-poppler-qt5在win7上安装错误

图片

直接安装不行,命名sipdistutils模块python-poppler-qt5的问题,于是我从python-poppler-qt5文件夹里找了一个网上的地方,上图有错误

我的环境:python3.4 pyqt5.4

我想用pyqt5做一个PDF阅读器。