问题标签 [docsplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
2746 浏览

ruby-on-rails - Docsplit Ruby on Rails

我正在尝试让docsplit与我的 rails 应用程序一起使用。现在我只是想让它在本地运行。我安装了 gem 和所有的依赖项。所有基本示例都在命令行中工作,我能够获得

在我的 Rails 应用程序中工作。但是,当我尝试使用 extract_images 时,即

我收到以下错误:

我仔细检查并安装了所有依赖项。我猜我在rails的配置中遗漏了一些东西。

谢谢。

0 投票
1 回答
4949 浏览

ruby-on-rails - 如何上传多页 PDF 并使用 Paperclip 将其转换为 JPEG?

有谁知道如何使用 Paperclip 上传多页 pdf 并将每一页转换为 Jpeg?

到目前为止,每次我上传 PDF 时,它只允许我将 PDF 的第一页视为 JPEG。但我希望能够上传 PDF 中的每一页并将其转换为 JPEG。

是否有任何 gem 或插件可以帮助我上传 10 pg PDF 并在数据库中转换/存储为 10 个 JPEG 文件?

我查看了docsplit-images gem,但我不确定这是否是最佳解决方案或它是如何工作的。

Post.rb

_form.html.erb

显示.html.erb

0 投票
1 回答
1802 浏览

imagemagick - Ghoshscript 错误:错误:/rangecheck in --.dicttomark--

我正在尝试使用 ghoshscript 转换图像中的 pdf。

PDF是: http: //www.coppernet.zm/MPLS.pdf

我试着应用这个: http ://thomas-genin.com/ghostscript-convert-error-undefined-in-findresource/它会产生这个错误。

编辑:如果我删除/var/lib/ghostscript/fonts/cidfmap文件,我就没有错误了。

0 投票
1 回答
269 浏览

fonts - 如何为 docsplit (ghostscript) 配置 CID 字体?

我在下面的网址中有指南参考。 http://www.ghostscript.com/doc/9.06/Use.htm#CIDFonts

但我认为我没有正确地遵循它。

我要做的是使用 Docsplit 将 Office 文件转换为图像。但有些字符(韩文和中文)显示为问号。

我认为它与ghostscript有关,但很难,因为我是基于linux的解决方案的新手。

有人可以告诉我如何配置 CID 字体的命令行指南吗?

0 投票
1 回答
3533 浏览

ruby - 使用 ruby​​ 应用程序时出现 remove_entry_secure 错误

我正在尝试使用 docsplit 将 PDF 文件拆分为图像。但看来我的 ruby​​ 安装有问题。我每次都收到以下错误:

这是完整的命令行输出:

有想法该怎么解决这个吗?

0 投票
2 回答
472 浏览

java - 无法使用 docsplit 转换 openoffice 文档,导致 java.lang.NoClassDefFoundError

我已经安装了 docsplit gem 并且能够转换 PDF 文档。但是,在拆分 openoffice 文档(例如 powerpoint 和 word 文件)时,出现以下错误:

我已经检查过该/usr/lib/openoffice文件夹是否可用。

我该怎么做?

0 投票
2 回答
1296 浏览

ruby-on-rails - 使用 docsplit 从内存中的文档中提取文本

使用docsplit gem,我可以从 PDF 或任何其他文件类型中提取文本。例如,使用以下行:

我可以拥有 PDF 文件的文本内容。

我目前正在使用 Rails,PDF 通过请求发送并存在于内存中。查看 API 和源代码,我找不到从内存中提取文本的方法,只能从文件中提取。

有没有办法让这个 PDF 的文本避免创建临时文件?

如果有关系,我正在使用 attachment_fu

0 投票
0 回答
157 浏览

ruby-on-rails - 从rails中的pdf解析复选框

我需要解析 PDF 中的复选框。我正在使用ruby的docksplit gem。问题是当解析pdf时,只有它的文本被解析并且没有复选框存在的迹象。

这是我的 PDF 复选框的屏幕截图(标有 cross(X) 的框已选中)。

在此处输入图像描述

有什么办法可以弄清楚它的选中或未选中的天气。可能是通过二进制数据?

0 投票
1 回答
359 浏览

ruby-on-rails - Docsplit 从控制台工作,而不是从 Rails 本身工作

我正在尝试找出 Docsplit 的一个奇怪问题。我有一个 Rails 2.3.14 应用程序,用户可以在其中上传 PPT/PDF,系统应该使用 Docsplit 提取封面图像。

我用这一行在模型中有一个 after_save 回调:

此行生成此错误:

我知道这是与 Ghostscript 相关的错误,但如果我从控制台手动执行该确切语句,一切正常。那么,可能是什么?

0 投票
1 回答
310 浏览

pdf - docsplit 转换为 PDF 会破坏 Linux 上 docx 中的非 ASCII 字符

我的文档管理应用程序涉及使用 docsplit 将包含非 ASCII Unicode 字符(日语)的 .docx 文件转换为 PDF(如果重要,通过 Ruby gem)。它在我的 Mac 上运行良好。在我的 Ubuntu 机器上,无论是通过 Ruby 调用还是直接在命令行上调用,生成的 PDF 都有字符所在的方框。奇怪的是,当我直接在 LibreOffice 中打开 .docx 文件并进行 PDF 导出时,它工作正常。因此,似乎 docsplit 如何调用 LO 在某些方面会导致 Unicode 字符处理不当。我已经搜索了文档和代码的各个部分以查找我可能需要指定的选项,但没有运气。关于为什么会发生这种情况的任何想法?

FWIW,docsplit 使用以下选项行调用 LO pdf_extractor.rb

我注意到输出格式可以选择跟随输出过滤器 a in -pdf:output_filter_name这是我需要考虑使用的东西吗?