问题标签 [poppler]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - 在 Qt5 中使用 poppler 链接时出错
/usr/lib/libpoppler.so.50:未定义对
std::__throw_out_of_range_fmt(char const*, ...)@GLIBCXX_3.4.20' Makefile:156: recipe for target 'DocViewer' failed /usr/lib/libsystemd.so.0: undefined reference to
lzma_stream_decoder@XZ_5.0' 的引用 /usr/lib/libQt5Core.so:未定义对__cxa_throw_bad_array_new_length@CXXABI_1.3.8' /usr/lib/libsystemd.so.0: undefined reference to
lzma_end@XZ_5.0' 的引用 /usr/lib/libsystemd.so.0:未定义参考 `lzma_code@XZ_5.0' collect2: error: ld returned 1 exit status make: *** [DocViewer] Error 1 20:53:35: The process "/usr/bin/make" exited with code 2.
poppler
使用in编译程序时出现上述错误Qt5
。
下面是我的项目文件,应该改变什么吗?
ruby - glib2 无法使用 cairo 和 poppler 编译 gem install 依赖项
我们正在使用 Cairo 和 Poppler c 库来获取 QR 码的东西,在 unix/linux/ubuntu 上,在生产和测试系统中一切都很好。Mac OS X 上的开发人员经常遇到这些 gem 的问题,例如当我们将 Mac OS x 从 10.9 升级到 10.10,或者将 ruby 从 1.9 升级到 2.1 时。
我们的工程师目前被困在 Ruby 2.1 Rail 3.2.21 和 Mac OS x 10.10 的最新问题上。我们已经安装了 RVM、HomeBrew、MacPorts。我怀疑苹果提供的不同 gcc 版本与 mac 端口安装的问题...我们尝试过切换符号链接,但不太确定....
欢迎任何想法/想法,谢谢!
python - 使用python更改PDF中突出显示注释的颜色
我想用 python 和 popplerqt4 更改 PDF 文件中现有高亮注释的颜色。我有一个包含现有 HighlightAnnotations 的 PDF 文档。对于给定的页面,我可以使用以下方法检索注释:
在这种情况下,它返回两个 Highlight 类型的注释。
setAuthor()
现在我可以分别使用和setHighlightQuads()
方法更改作者或更改这些注释的四边形。这非常有效,并且在保存文档时具有预期的行为(使用pdfConverter()
)。
我的问题是,annotations
上面给出的改变高光颜色的正确方法是什么?例如,我已经在他们使用的几个 c++ 示例中看到过annot->style().setColor( RED );
。如何使用 python 访问我的注释的样式属性?在我的示例中,我只能访问以下属性。提前感谢您的任何提示!
我正在使用以下软件包:
poppler - 使用 pdftohtml poppler 实用程序将多页 PDF 转换为单个 html 文件
我正在使用 poppler 实用程序将 PDF 文档转换为 HTML。但它为每个页面创建单独的 html 文件,但在将 pdf 转换为 html 后我想要一个 HTML 文件。
我使用了以下语法:
但它创建 abc-1.html、abc-2.html、....等
我也尝试过 pdftohtml -c abc.pdf abc.html
但没有得到预期的输出。
谁能告诉如何在单个文件而不是多个 html 文件中获取 html 输出?
linux - 支持pdf的开罗
我正在手动编译 GTK+,因为它需要具有 pdf 支持的 Cairo 我安装了 poppler-glib 但即使在 cairo 的配置脚本中我得到:
我使用apt-get libpoppler-glib-dev
. 有什么帮助吗?
linux - 如何从 Linux 命令行从“受读保护”的 PDF 中提取所有图像?
我正在尝试从受读保护的 PDF 中提取图像。
对于普通 PDF,Poppler 库可以很好地提取图像,而从受读保护的 PDF 中,它也可以很好地提取文本。这些图像是一个不同的故事。它要么不提取所有图像,要么以模糊的灰色或黑色提取所有图像。
在以下 PDF(此处为原始 PDF)中,您可以在许多图像下方的缩略图中看到:
我尝试了Poppler 库pdfimages
中的命令:
和pdftohtml
来自mupdf的命令:
但是这两个库都只提取了许多图像中的一个。不过,该图像已正确提取。我从其他 PDF 中得到所有图像,但它们都是灰色或黑色的。
由于读保护应该只是 PDF 文档中的一个标志,而不是对源的实际加扰或加密(最终您的计算机可以在不输入密码的情况下显示图像),因此应该可以以某种方式单独提取图像. 我什至可以使用ImageMagick ( )从整个 PDF 创建缩略图convert ticket.pdf ticket.jpg
,那么为什么不单独图像呢?
有人知道如何从受读保护的 PDF 中提取所有图像吗?欢迎所有提示!
python - 什么是“没有空字节的字符串,而不是二进制”的数据?
我可以使用poppler 库轻松地从 pdf 创建图像:
我现在正在尝试使用python-poppler 库在 Python 中执行相同的操作。安装 lib ( sudo apt-get install python-poppler
) 后,我可以使用以下命令加载 pdf 文件:
但我现在想从二进制文件中加载一个 pdf 文件。我以为我可以使用该方法poppler.document_new_from_data()
,所以我尝试了以下方法,它返回了一个类型错误:
我不确定这意味着什么。什么“数据”可以是“没有空字节的字符串,而不是二进制”?我尝试检查该方法的源代码,但源文件(此处)甚至不包含单个.py
文件。
我尝试将二进制文件转换为 base64,但这会导致错误提示TypeError: Required argument 'length' (pos 2) not found
。
欢迎任何帮助!
[编辑] 感谢@Vaulstein 的提示,我现在更进一步:
但它似乎仍然不是正确的编码。还有其他想法我该怎么做吗?
cmake - cmake 构建和 INCLUDE_PATH
我正在尝试通过cmake
生成的 make 构建一个项目,其中一个必要的头文件是/usr/local/include/poppler/poppler-config.h。然而
export INCLUDE_PATH=/usr/local/include/poppler/
也不
export INCLUDE_PATH=/usr/local/include/
帮助,我仍然得到:
fatal error: poppler-config.h: No such file or directory
.
我会错过什么?
我已经有一个用于此依赖项的 pkg-config 文件,看起来不错:
但是将其添加到PKG_CONFIG_PATH
环境变量中也无济于事。
是否有一些 cmake 缓存可以为此重置?什么应该是一个优雅的解决方案?
python - PySpark:如何在工作人员上安装 linux 命令行工具?
我正在尝试使用 Linux 命令行工具“Poppler”从 pdf 文件中提取信息。我想为几个 Spark 工作人员的大量 PDF 执行此操作。我需要使用 Popples,而不是 PyPDF 或类似的东西。
有人知道如何在工人身上安装 Poppler 吗?我知道我可以在 python 中进行命令行调用,并获取输出(或通过 Poppler lib 获取生成的文件),但是如何将它安装在每个工作人员上?我正在使用 spark 1.3.1 (databricks)。
谢谢!
windows - 通过 Python 在 Windows 上运行 PyPDFOCR - 需要 Poppler?
我正在做一个项目,该项目需要将 PDF 转换为可搜索的对应文件,并且发现 PyPDFOCR 正是我完成工作所需的。但是,在尝试安装模块及其外部依赖项时,我遇到了无法下载任何与 Windows 相关的定义的问题,pdfimages
例如 Poppler。我到处搜索安装 Poppler 以运行该模块的任何方法,但似乎没有任何支持或工作。有任何想法吗?