将 .doc 或 .pdf 转换为图像并在 Ruby 中显示缩略图?
有谁知道如何在Ruby(或C,python ...)中生成文档缩略图
6 回答
将 PDF 转换为 PNG 的简单 RMagick 示例如下:
require 'RMagick'
pdf = Magick::ImageList.new("doc.pdf")
thumb = pdf.scale(300, 300)
thumb.write "doc.png"
要转换 MS Word 文档,不会那么容易。您最好的选择可能是在生成缩略图之前先将其转换为 PDF。您生成 PDF 的选项很大程度上取决于您运行的操作系统。一种可能是使用 OpenOffice 和Python Open Document Converter。您还可以尝试在线转换服务,包括http://Zamzar.com。
回答上述@aisensiy 评论的示例代码:
require 'rmagick'
pdf_path = "/path/to/interesting/file.pdf"
page_index_path = pdf_path + "[0]" # first page in PDF
pdf_page = Magick::Image.read( page_index_path ).first # first item in Magick::ImageList
pdf_page.write( "/tmp/indexed-page.png" ) # implicit conversion based on file extension
基于回答另一个问题的路径线索:
不确定任何开源库中的 .doc 支持,但 ImageMagick(和 RMagick gem)可以使用 pdf 支持编译(我认为默认情况下它是打开的)
ImageMagick 中的 PDF 支持有点问题 - 但它是迄今为止 ruby 的最佳操作系统方式。还有一个纯 Ruby PDF 支持的谷歌夏季代码项目。
我已经阅读了有关在没有 GUI 的情况下使用 OpenOffice 来转换 .doc 文件的内容 - 但它充其量只是复杂的。
正如前两张海报所说,ImageMagick 可能是生成缩略图的最简单方法。
您可以执行以下操作:
´convert -size 300x300 doc.pdf doc.png´
(反引号告诉 Ruby 将其去掉)。
如果您不想使用 exec 进行转换,您可以使用 RMagick gem 为您完成转换,但它可能需要更多代码。
如果您不介意为 Imgix 付费,它也可以处理 PDF。使用它,您可以获得快速 CDN 的所有好处。