2

我需要读取和写入 pdf 文件,并且在某些情况下将我拥有的 pdf 与我需要读取的文件合并。我尝试使用 pdf-reader gem 和 prawn gem 来做到这一点。

pdf-reader gem 似乎不允许直接复制文件,而是只从文件中提取文本而不进行格式化或图像,除非您单独编写它们。即便如此,它也只会提取文件片段并跳过其他文件。红宝石还有什么其他的吗?

编辑:更具体地说,在某些情况下,我需要精确的 pdf 副本,而在其他情况下,我需要将一个副本覆盖在另一个副本之上。pdf-reader 或 docsplit 似乎都无法制作副本(读取文本/格式/图像/字体等)。

4

4 回答 4

0

您可以使用 Lucene 或 Solr(具有 Ruby on Rails 的挂钩)来索引和读取 .pdf 文件以及 Microsoft 文档(即 Word、PowerPoint、Excel)。

于 2015-01-18T20:07:55.477 回答
0

https://github.com/paulschreiber/pdf-merger

于 2011-11-26T05:32:12.780 回答
0

试试这个:Prawn:为 Ruby 生成快速、灵活的 PDF https://github.com/sandal/prawn

于 2011-12-05T03:21:10.617 回答
0

在玩了很多之后,我发现了这个问题:overlay one pdf or ps file on another

似乎 pdftk 和它会得到的一样好。

Rails 对此有一个 gem,但它看起来不支持覆盖: http: //pdf-toolkit.rubyforge.org/

编辑:看起来有更好的宝石,但未发布支持覆盖:https ://github.com/tcocca/active_pdftk

于 2012-01-06T21:17:59.953 回答