问题标签 [poppler]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - 加载共享库时出错:libpoppler.so.58:无法打开共享对象文件
我按照说明编译并安装了 poppler-0.39.0。默认情况下,头文件进入 int\usr\local\include
并且 lib 文件进入\usr\local\lib
. pdftohtml 安装在\usr\local\bin
.
现在,当我尝试运行时pdftohtml
,它会出现以下错误。
虽然libpoppler.so.58
存在于\usr\local\lib
. 请帮我。
c++ - c++ qt libpoppler 多线程问题
使用 libpoppler-qt5.so。我使用以下代码从 PDF 文档中提取文本:
但是当它用于多个线程时会出现段错误。对于一个线程,它似乎没问题。这个代码线程安全吗?是否有任何其他线程安全库可以从 PDF 文档中提取文本?谢谢你
php - PHP Poppler 实现失败
除了将文件转换Poppler
为. 我通过安装该库,不幸的是,除了一些有关安装的指南外,没有可用的文档,但仍然不完整。PDF
HTML
composer
鉴于此Main API usage
:
我什至无法定义应该给出哪些参数$file = new Poppler\Process\PdfFile(...);
我试过的:
这给出了一个错误:
这是 PdfFile.php:
php - 在 PHP 中使用 exec() 安装 poppler
我对使用Linux
命令很陌生。我正在尝试安装Poppler-Utils
使用Linux
此PHP
代码:
输出:
- 这是什么意思?
Poppler-Utils
它是在 Linux 服务器上安装的正确方法吗?
任何帮助表示赞赏!
pdf - 如何将带有“pdftocairo -eps”的“横向”PDF转换为正确的EPS?
我不知道如何使用该工具将带有单张图片的“横向”PDF 文件(例如,paperwidth=842 和 paperheight=595 点以及填充整个页面的图像)pdftocairo
转换为 EPS 文件。
我得到的输出要么是原始文件的缩小版本(宽度从 842 缩放到 595 以适应 EPS 文件的“不正确”页宽 595),要么是 595 和 842 之间的内容被截断的 EPS(与-noshrink
参数)。
有任何想法吗?
编辑1:pdftocairo version 0.43.0
输入PDF:
pdfinfo test.pdf
Creator: DocType PDF-Emitter (DocType PDF-Emitter v1.9.37-9-g1b2b6f3)
Producer: Haru Free PDF Library 2.3.0RC2
CreationDate: Mon Jun 4 11:18:30 2018
Tagged: no
UserProperties: no
Suspects: no
Form: none
JavaScript: no
Pages: 1
Encrypted: no
Page size: 595.44 x 841.68 pts
Page rot: 90
File size: 149246 bytes
Optimized: no
PDF version: 1.3
用 pdftocairo -eps test.pdf 转换
python - Losing information when extracting text from PDF using PDFMiner
I'm using Python 3.4 on Windows 7 and hoping I can extract text from PDF files using PDFMiner. However, losing information was quite common when I was testing. For some files, it may be just a matter of a few sentences. But I've encountered situations where half of the text could not be extracted, depending on the file format. Here's my full code:
I wonder if there's a way to extract the full text using PDFMiner. I've heard of poppler, but I can't seem to find how to use it as a Python library. Besides, I don't want to use the command line. Can anyone help?
Here's an example: a thesis. Several paragraphs were lost when extracting using the code above. Like in the 2nd page, I could only extract first half of the page until "Pereira, Tishby, and Lee (1993)" at the middle. Then it just skip right to the next page for no apparent reason.
cairo - 我应该什么时候使用 poppler_page_render 和 poppler_page_render_for_printing?
有两个函数可以在 cairo 表面上呈现 PopplerPage:poppler_page_render
和poppler_page_render_for_printing
. 该文档指出,后者应该用于“渲染将要打印的页面”。
我的问题是:如果以后将我的 cairo 表面保存为 (pdf) 文件,我应该使用其中哪一个?另存为文件是否构成poppler“打印”?我将不胜感激参考文档。PopplerPage 是由 pdf 文件创建的poppler_document_get_page
吗?
qt - 如何在窗口上将 poppler 0.45 编译为 Qt5.5.1 的 DLL
我想在窗口上为 Qt5.5.1 构建 poppler0.45 版本的 DLL。我按照http://www.seppemagiels.com/blog/building-poppler-windows-using-mingw上的指南进行操作,但没有成功。我使用 CMake 工具编译库。下面的错误:
如何正确配置值?或者如果已经存在 poppler 0.45 的 DLL,请与我分享。
pdf - PDF 优化:pdftops -passfonts - 它如何使 PDF 加载速度更快?
几周前,我们的用户指出一些大型 OCRed PDF(ABBYY 生成)加载速度非常慢,并要求我们对其进行一些优化。
经过一番调查,问题似乎是由 PDF 中嵌入的复杂文本引起的。我尝试了不同的脚本来优化 PDF,例如 ghostscript、qpdf 等...
我发现的唯一一个显着改进是使用带有 -passfonts 选项的 pdftops(来自 poppler)并使用 ghostscript ps2pdf 将其转换回 PDF: pdftops -passfonts intput.pdf output.ps && ps2pdf output.ps output.pdf .
但是,问题是我不知道 -passfonts 如何使 PDF 加载更快,以及它是否会产生我不知道的副作用......
那么 PDF 专家能否阐明这种优化背后的原因/逻辑?
谢谢大家!!杰弗里