1

pdf2htmlEX 以 HTML 格式呈现 PDF 文件。它旨在提供准确的渲染,同时保持针对 Web 显示的优化。经过一些演示后,我被说服使用它:

演示1

演示2

我可以设法安装 pdf2htmlEX 并将本地 PDF 转换为 HTML,但是我想在我的 rails 应用程序中使用它。所以,我找到了克里斯汀宝石,正是它。

我担心的是我缺乏使其工作的一些知识,基本上是如何使用这个宝石。这是kristin的 repo ,在使用部分中写了要做什么。我关心的一些基本问题:

  1. 我究竟在哪里存储需要“克里斯汀”?目前它在 application.rb
  2. Kristin.convert(' http://www.selab.isti.cnr.it/ws-mate/example.pdf ', 'example.html')。我在哪里存储这条线?我尝试了很多方法,但没有成功。

我假设在这几个步骤之后,我将在我的应用程序中获得 pdf2htmlEX 的基本功能?

谢谢!

4

2 回答 2

1

CloudConvert ( https://cloudconvert.com/ ) 是一种免费/廉价的在线服务,它使用与 gem 相同的pdf2htmlEX(C++) 软件kristin,但允许您通过以下方式将 PDF(或许多其他文件类型)转换为 HTML(或其他)一个非常简单的 API,而不必安装pdf2htmlEX在本地机器/生产服务器上。gemcloudconvert-ruby包装了 CloudConvert API,因此这一切都非常简单且以 Ruby 为中心。

请注意,pdf2htmlEX生成的 HTML 文档(无论是内联文件还是分隔文件 [图像、CSS 文件、HTML、JS 等])具有 HTML/CSS 结构,在不破坏代码的情况下几乎不可能进行编辑。

于 2017-08-16T20:30:14.813 回答
0

您现在可能已经找到了解决方案,但是对于后代,您可以require 'kristin'在任何需要使用的.rbgem 'kristin'文件中使用它(尽管如果您添加到 Gemfile中,Bundler 应该会为您处理这些问题)。然后,您可以在需要的任何地方继续使用辅助方法Kristin.convert(...)

只需意识到这不是您的生产环境的“直接”解决方案。您还需要在生产机器上安装 pdf2htmlEX(因此 kristin 示例中的注释:)# This requires that the pdf2htmlEX command is present in your PATH.例如,您无法在 Heroku 等托管 PaaS 上执行此操作。

希望这可以帮助某人。

于 2014-01-16T23:49:56.050 回答