问题标签 [xpdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vim - 如何在 xdvi 中添加 find-previous 或在 xpdf 中为 vi 键绑定添加 findPrevious?
有没有办法在 xdvi 中添加 find-previous 函数或在 xpdf 中添加 findPrevious 函数?这些将等效于一个功能,该功能会在已选中“向后搜索”选项的情况下显示搜索对话框。
我需要这样的功能来定义键绑定
在我的 .xpdfrc 和
在我的 .Xdefaults 中。然后,我将在两个程序中都有一套完整的类似 vi 的键绑定。
c++ - 使用 XPDF(或其他东西)编辑 PDF
我想问是否可以使用xpdf库编辑 PDF 文件,如果可以,如何?我想这是可能的,但我找不到任何关于 xpdf 的教程或文档,所以我真的不知道 :(。如果任何其他库支持pdf编辑,我也可以使用另一个库。我对此类库的唯一要求是它必须是C++库或至少是C库,并且必须是跨平台的(Windows 和 Linux)
我只需要对 pdf 文件进行基本编辑,例如:
“这是 pdf 文档中的文本”将更改为“这是 pdf 中的文本”,文本颜色也不同。
感谢您的回复!
php - 提取 PDF 的目录?
我在 SWFTools 和 XPDF 的帮助下将 pdf 提取到图像/swf 和文本中。我在 PDF 脚本中运行这些。
但是现在我试图更进一步,尝试从 PDF 中获取 TOC 是否可以提取此信息?
php - 如何在 Godaddy Linux 共享主机服务器上安装 xpdf?
根据我对 Godaddy 服务器的访问量,我无法确定是否可以安装 XPDF。有人可以对此有所了解吗?这是XPDF的链接。
这是有关GoDaddy 服务器的信息。
我的目标是使用服务器上的 PHP 脚本自动将 PDF 转换为纯文本。到目前为止,PHP网站评论中发布的代码等其他解决方案还不够。所有研究似乎都指向 XPDF。
c# - .NET 项目最快的 PDF-> 文本库
我正在尝试创建一个应用程序,它基本上是我的 PDF 收藏的目录。我们谈论的是包含数万个 PDF 的 15-20GB。我还计划包括一个全文搜索机制。我将使用 Lucene.NET 进行搜索(实际上是 NHibernate.Search),以及一个用于 PDF-> 文本转换的库。哪个是最好的选择?我正在考虑这些:
- PDFBox
- pdftotext(来自 xpdf)通过 c# wrapper
- iTextSharp
编辑:其他不错的选择似乎是使用 iFilters。与这些库相比,它们的性能(速度/质量)如何(Foxit/Adobe)?
商业图书馆可能是不可能的,因为它是我的私人项目,而且我真的没有商业解决方案的预算 - 尽管 PDFTextStream 看起来非常好。
从我读过的内容来看, pdftotext比PDFBox 快得多。与 pdftotext 相比,iTextSharp 的性能如何?或者也许有人可以推荐其他好的解决方案?
c# - 使用 pdfcreator 处理 pdf 或其他图像的数据
干草。也许你们可以在我的项目中帮助我。我使用 pdfcreator 作为虚拟打印机将一些图像打印到文件中。可以是pdf 可以是任何类型的图像。但我需要从中提取数据。可以吗?我使用 C#。
python - 扫描受保护的 pdf 文档
我目前遇到需要查找目录中的哪些 pdf 是“安全文档”。所有的 pdf 文件都应该是不安全的,并且可以通过 xpdf 进行转换,但是事实并非如此。我如何扫描目录中的所有 pdf 文件以了解它们是否安全?
performance - 在从 pdf 页面渲染图像时,MuPdf 库是否比 xpdf/poppler 更快?
MuPdf 库在从 pdf 页面渲染图像时是否比 xpdf/poppler 更快?他们说这是高性能。
c# - 将pdf转换为文本
我需要创建一个将 pdf 文件转换为 txt 的 C# 或 C++ (MFC) 应用程序。我不仅需要转换,还需要删除页眉、页脚、左边距上的一些垃圾字符等。因此,应用程序允许用户设置页边距以切断不需要的内容。我实际上已经使用 xpdf 创建了这样的应用程序,但是当我尝试将自定义标签插入到提取的文本中以保留斜体和粗体时,它给了我一些问题。也许有人可以提出一些有用的建议?
谢谢。
pdf - 如何通过 xpdf 或 mupdf 获取指定的文本 pos?
我想提取pdf文件中的一些指定文本和文本位置。
我知道 xpdf 和 mupdf 可以解析 pdf 文件,所以我认为它们可以帮助我完成这项任务。
但是如何使用这两个库来获取文本位置呢?