问题标签 [docsplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
17365 浏览

python - 将文档转换为 pdf 格式的有效方法

我一直在尝试找到将文档(例如 doc、docx、ppt、pptx)转换为 pdf 的有效方法。到目前为止,我已经尝试过docsplitoowriter,但两者都花费了 10 秒以上的时间来完成大小为 1.7MB的pptx 文件的工作。有人可以建议我更好的方法或建议来改进我的方法吗?

我试过的:

输出:

环境:

  • Linux - Ubuntu 12.04
  • Python 2.7.3

更多工具结果:

0 投票
1 回答
795 浏览

ruby-on-rails - 在 Rails 中将 PPT 转换为图像

我正在使用 docsplit gem 将 PPT 转换为图像

它转换成功,但我需要更多时间。我可以转换任何其他方式请任何人帮助我。

0 投票
2 回答
292 浏览

plone - 克隆和文档查看器

我正在做Plone。我已经成功安装了文档查看器:现在我可以很好地预览上传的 pdf。

问题在于world和excel 文件预览。正如要求所说,我必须安装 OpenOffice 或 LibreOffice 才能获得该结果。

我为实现目标所做的工作:

将文件上传到测试文档查看器后收到的错误:

阅读部分代码(来自 DocSplit,对文档查看器的要求)我可以看到 DocSplit 检查(第 57 行)中是否存在 openoffice/libreoffice 安装:

我的 OpenOffice 安装位于“/usr/lib64/openoffice.org”中。这可能是问题吗?如果没有,我该怎么做才能解决这个问题?

0 投票
0 回答
5716 浏览

ruby-on-rails - 没有这样的文件或目录@ rb_sysopen (Errno::ENOENT) - DOCSPLIT

我正在尝试使用 Docsplit 从 Microsoft Office Word 文档中提取图像并返回此错误:

这是脚本:

这是 transparent_pdfs 上的第 22 行:

我正在使用安装了所有库的 Centos 6,在 Mac Os X 上以同样的方式工作得很好。如果我尝试转换 pdf 效果很好,只有办公文档会失败。

有任何想法吗?

谢谢,

0 投票
0 回答
107 浏览

ruby - 如何使用 Paperclip 上传多页 PDF 并将每一页转换为 JPEG?

有谁知道如何使用 Paperclip 上传多页 pdf 并将每一页转换为 Jpeg?

到目前为止,每次我上传 PDF 时,它只允许我将 PDF 的第一页视为 JPEG。但我希望能够上传 PDF 中的每一页并将其转换为 JPEG。

是否有任何 gem 或插件可以帮助我上传 10-pg PDF 并将其转换/存储在数据库中作为 10 个 JPEG 文件?

我看过docsplit-images gem,但我不确定这是否是最好的解决方案或它是如何工作的。

Post.rb

_form.html.erb

显示.html.erb

0 投票
1 回答
1161 浏览

ruby-on-rails - docsplit gem pdf转文本

0 投票
0 回答
253 浏览

ruby-on-rails - 阅读带有图像的文档 (.doc)

我需要用 ruby​​ 阅读文档文本,然后对其内容执行一些操作。其中一些文档包括我需要上传到我的服务器的图像,然后用图像显示数据。关于如何实现这一目标的任何想法?

我正在考虑使用doc_ripper/ docsplit,但ripper没有谈论图像提取,并且docsplit似乎只截取整个页面的屏幕截图。

如果这不可能,我可以通过一种方法将图像文件名恢复到正确的位置,这样我就可以提取文件并手动上传。

0 投票
0 回答
47 浏览

ruby-on-rails - What would cause RSpec to print out wrong array size until after to_yaml?

RSpec seems to not output the right size of an array, almost like it does not process everything until it is asked to output something. What might be causing this?

Here is a portion of the spec code:

The above code outputs:

There are no threads in the program unless DocSplit is using some sort of threads that I am unaware of. I think that this is an indicator of a larger problem, but I am lost as to what it might be.

Edit: The same thing occurs if I instead (replace the code above with the following) go through and save each of the relationships:

Except that the results are:

Edit 2: The Relationship class also belongs to two digits and digits have many relationships. Could that be influential? Here is the code from relationship.rb

0 投票
0 回答
201 浏览

ruby-on-rails - CollectionsController 中的 NoMethodError #create undefined method `file' for nil:NilClass

我正在尝试通过 rails 将 pdf 文件上传到保管箱,并将 pdf 中的页面转换为 jpeg 图像并将这些图像存储在同一个保管箱文件夹中。我尝试使用 Docsplit gem,但我不知道如何在代码的下拉框中处理文件。

Docsplit.extract_images(@collection.file.url, :format => [:jpeg])

file.url 应该返回文件吗?还是其他方式??

谢谢,

0 投票
1 回答
241 浏览

ruby-on-rails - 使用 Docsplit 计算 ROR 中的 PDF 页面

我需要使用 Docsplit 获取存储在 Ruby on Rails 5.2.3 ActiveStorage 中的 PDF 文件的页数。

我正在使用 Ruby on Rails ActiveStorage 上传 PDF 文档。我了解这些文档存储为 blob。我希望我可以将 PDF 文件的引用传递给 Docsplit,例如:

但是上面导致了一个错误: