问题标签 [pdf-rendering]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
600 浏览

iphone - 如何为在 ipad 中绘制当前 pdf 页面的 NSOperation 设置高优先级?

我正在为 ipad 开发一个自定义 PDF 阅读器。我已经在其中UIScrollView添加/删除UIViews了相应的 pdf 页面的等效缩略图。我正在创建一个NSOperation并添加到 aNSOperationQueue一旦UIView添加到滚动查看以在背景中生成 PDF 缩略图。在任何时间点,滚动视图上都会有 3 个 UIViews。整个安排适用于小 PDF 文件,因为它们渲染速度很快,但问题在于大/复杂的 PDF 页面,当曾经用户在特定页面离开导航,根据我的实现,将有 3NSOperations同时在后台工作以生成 3 个缩略图(一个用于上一页,一个用于当前页面,另一个用于下一页)因此需要很长时间才能显示当前页面。我尝试遍历所有活动NSOperation对象并设置高优先级假设在 scrollViewDidEndDecelerating: 方法中呈现当前页面缩略图,但它不起作用并且结果仍然相同。请建议我解决我的问题的方法,在此先感谢。

0 投票
2 回答
7653 浏览

python-3.x - 使用 python3 显示 PDF 文件

我想编写一个显示 PDF 文件的 python3/PyGTK3 应用程序,但我找不到允许我这样做的 python 包。
pypoppler,但它看起来已经过时(?)并且似乎不支持 python3(?)

你有什么建议吗?

编辑:请注意,我不需要花哨的功能,例如 pdf 表单、操作或写作。

0 投票
1 回答
170 浏览

parsing - PDF 页面组件(解析、字体、图形等)的渲染时间

我想知道PDF页面渲染(对于普通技术书籍)中哪些操作花费的时间最多。是字体渲染吗?是对象解析吗?是图形绘制吗?或者还有什么?

0 投票
2 回答
6317 浏览

c# - 用于渲染 PDF 和 OCR 生成图像的 C# 解决方案?

我正在寻找一种 C# 解决方案,用于在商业应用程序中将 PDF 文档中的数据导入我们的数据库。我们的客户将希望导入任意文件。通常我会把它写成完全不可能的,但是他们正在导入的文档将在他们自己的设置布局中。

我的计划是将 PDF 呈现为静态图像,然后允许用户设置自己的模板,这些模板基本上使用 OCR 在 PDF 中以预定义的像素偏移量提取文本。对于表,它们定义了表的位置以及列和行大小的一系列进一步值。然后,我们可以将模板应用于该文档类型。

所以,我真正在寻找的是两个库:一个用于将 PDF 转换为图像,另一个用于对这些图像进行 OCR。

要求:

  • 是纯 C# 或在本机 DLL 上具有受支持的 C# 包装器。
  • 不派生进程 - 在这种情况下,不允许使用本质上只是创建命令行参数并启动外部可执行文件的包装器。
  • 在 FOSS 的情况下,允许我们通过支付许可费来免除正常的 FOSS 许可要求(即发布我们的源代码)。

我们当然不介意为商业解决方案付费,但我们宁愿不拘泥于为软件的每个单独分发付费。

我知道这是一个非常具体的要求集 - 可能足以让某些人认为这个问题过于本地化,但我希望有人可以提出一种方法和一些对我以及未来其他人有帮助的库.

我在 PDF 方面研究过的东西:

  • iTextSharp - 文档是你必须买的书,不是一个好的开始。关于将 PDF 转换为公共领域的图像似乎没有太多有用的文档。许可是不透明的,看起来我们必须为我们分发给的每个客户付费。
  • Docotic.Pdf - 纯文本,对我们没用。
  • pdftohtml - 同样,不产生图像。移植到 C# 也会很麻烦。
  • PdfFileParser - 仍然不是我们需要的。
  • GhostScript - 几乎正是我们想要的,但需要分叉到一个程序。

对于 OCR 方面,我可能最终会使用 Tesseract,因为 Apache 许可证是宽松的,并且得到了很好的评价。如果有替代方案,我也会对此感兴趣。

0 投票
1 回答
735 浏览

android - 渲染/显示和播放嵌入 pdf、Android 的 youtube 视频

我有一个包含超链接和嵌入其中的 YouTube 视频的 PDF。

目标:需要打开 PDF 并且所有超链接和视频都应该可以工作。

结果:我尝试了许多项目和第三方应用程序。他们中的大多数使用 MuPDF,并且无法播放 YouTube 视频。

我可以尝试使用 native 或 PhoneGap。

0 投票
1 回答
242 浏览

android - 在 Android 上运行 NDK 项目

我正在尝试开发应用程序的一部分,使其能够将 PDF 文件的页面呈现为位图,或将其显示在查看器上。我正在寻找一个免费的开源软件。我已经尝试了很多,例如droidreaderandroid-pdf。问题是我认为它需要 NDK 才能运行,我在尝试在 Eclipse 上构建它时不断出错,即使我直接使用 SVN 导入它。任何人都可以向我推荐一个好的分步教程,至少可以帮助我运行这些项目吗?

0 投票
2 回答
5139 浏览

android - 如何使用 PDF 库在 android 应用程序中呈现 pdf

我在 PDF 渲染方面进行了很多搜索,但没有得到正确的答案。谁能告诉我哪个库(根据 GPL 许可)渲染 PDF 以及如何渲染该 PDF。如果有人有示例代码,那么它将对我更有帮助。

0 投票
2 回答
1541 浏览

pdf-rendering - android项目中编译的MuPDF库集成

我已经编译了 mupdf 库,但是当我将它集成到我现有的 android 项目中以呈现 PDF 时,它给了我以下错误:

我已按照以下步骤进行集成:

步骤在这里解释:http: //pastebin.com/YzHUhzE7

当我在 mupdf 测试项目中更改包名称时,本机代码会被修改,并且会出现上述问题。因此,如果有人知道如何将 MuPDF 集成到我的项目中编译。

0 投票
1 回答
5791 浏览

internet-explorer - 在 IE 浏览器中打开 PDF 时出现网络错误

Internet Explorer(所有版本)中的 Adob​​e Reader 浏览器插件在渲染某些 Pdf 时显示以下消息"A network error occurred while accessing this document on the Internet. Would you like to close the document or reload it?"

此消息仅在 IE 中出现。我正在使用 Windows Server 2008 R2 标准操作系统、IIS 7.5 服务器将 Tomcat 7.0.29 作为 Web-App 服务、IE 9 和 Adob​​e reader XI 启动。使用 Tomcat 6、IE 其他版本和 Adob​​e Reader 9 时存在问题。

我在网上浏览了这个错误,发现所有相关的有趣原因,这个长线程中的电子邮件谈论它是否是 Tomcat 问题

其他链接,如http://support.microsoft.com/kb/979543/en-ushttp://helpx.adobe.com/acrobat/kb/handling-byte-range-requests-iis.html会建议一些真正的东西关闭该问题并说要进行修补程序。我尝试了修补程序并收到一条消息“此更新不适用于计算机”。

我使用 Fiddler2 发现,当 Adob​​e-Plugin 在请求标头中请求具有多个字节范围的 IIS 服务器时,来自 IIS 的相应响应将不会具有相同的请求字节长度。

例如,如果请求标头具有“范围:字节=1638400-1646079, 1650688-1652223”,则响应具有标头“内容类型:多部分/字节范围;边界=CATALINA_MIME_BOUNDARY”,“内容长度:9458”,“接受范围” :字节”。请注意,响应的内容长度比请求的多 242 个字节。当 Request-"Range: bytes=1589248-1605631, 1605632-1622015" Response-"Content-Length: 33010" >> 242 bytes 以上时也会发生同样的情况。

我清楚地知道,一旦这个请求和响应会话发生,消息就会出现。请告诉我是否有人在请求和响应中观察到相同的情况,为什么会发生这种情况以及如何解决或解决它?AdobeXI插件或IIS7.5或Tomcat有问题吗?

0 投票
2 回答
743 浏览

java - 在不丢失数据的情况下将阿拉伯文 pdf 转换为图像

我正在尝试将带有阿拉伯字符的 PDF 转换为图像以用作我网页上的缩略图。 PDFrenderer,PDFBox 转换后都不能保留阿拉伯字符,我只设法获得了令人满意的结果JMagick,但问题是它使用了 adll和其他一些我无权添加到我的应用程序安装程序中的依赖项。

有没有我可能错过的更好的开源解决方案,最坏的情况是什么是最好的支付解决方案?

谢谢

这是我的 pdf 模拟文件:

pdf文件