问题标签 [document-conversion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
12859 浏览

document-conversion - 如何预览文件?

我在一个文件共享网站上工作,我需要一种方法来截取上传的文件。

该站点将支持多种文件格式,从纯文本到办公文档(doc、xls、ppt、...)、视频(mpeg、avi、...)、图像(jpg、gif、png...)PDF , 开放式办公室等

每个文档都需要对其进行“预览”,好处是客户希望以下格式具有预览:doc、xls、ppt 和 pdf。其他文件格式是可选的,如果我能找到获取它们的方法,它们将有预览。

此外,图像不是问题,因为我只需要在预览中包含一个缩略图。此外,我将使用 FFMPEG 将视频转换为 FLV,以便我也可以使用它来截取视频。

我正在考虑使用支持 Office 和 Open Office 格式的JODconverter,我不知道它是否可以转换为 JPG,但至少它可以转换为 PDF 格式。该站点是在一个专用 Debian 服务器上运行的 Drupal 5 下用 PHP 构建的,所以如果我选择 JOD,我会将它用作在同一台机器上的虚拟服务器中运行的 web 服务。

有人知道将文件转换为图像的更好的应用程序或方法吗?

任何帮助将不胜感激,在此先感谢!

哈维尔

0 投票
2 回答
2875 浏览

openoffice.org - 使用 OpenOffice SDK 进行文档转换

我需要能够允许用户将他们的 .doc 文件(他们上传)导出为各种格式。我开始使用 OO SDK,并且还使用 XSLT 设置了一些自定义过滤器。一切正常,我可以将 word 文档导出为 pdf 等。

但是我想将其作为 Web 服务运行。我希望在专用节点上运行此转换服务,因此想要转换其文档的用户上传的所有文件都将到达此专用节点。我的网络应用程序本身是基于 PHP 的。使用 OO SDK 执行转换的最佳方法是什么?我还必须将生成的文件存储在数据库中。

我是否需要运行多个 OO 实例并将每个文件提供给要转换为特定实例的文件?而且,我是否需要编写一个自定义服务器来处理这个问题,因为我不知道 OO 是否是多线程的。非常感谢任何建议。

0 投票
1 回答
2670 浏览

asp.net - 将 Word 文档转换为 ASPX?

有没有一种简单的方法可以保留格式?

0 投票
6 回答
42645 浏览

html - 将pdf、doc、ppt转换为html5

我已经用谷歌搜索(没有任何运气)open source software that can convert doc, ppt, and pdf to HTML5.Scribd到底是做什么的)是否有与 Scribd 的转换类型等效的开源代码?

如果有人知道付费服务,那也可以。Scribd 有一个API,但它是用于 flash 查看器的。另外,我想托管自己的内容,因为我需要进一步控制转换后的 html 文档

0 投票
1 回答
481 浏览

django - 使用 python-Django 进行 PPT 转换的问题

我只是尝试使用以下 URL http://code.google.com/p/qifei/wiki/PDFConverter python 代码转换 PPT

我也可以看到命令行选项也发生了同样的事情

python documentconverter.py /home/rajeev/Desktop/Downloads/Industry2.ppt /home/rajeev/Desktop/test.pdf

在某些情况下,图像似乎与某些文本重叠。是否有任何解决方法。

0 投票
0 回答
2000 浏览

pdf - 将带有 MergeFields 的 Word 文档转换为带有表单域的 PDF

我有一个 Word .doc 格式的文档模板。Word 文档包含需要动态填充的合并字段。

我需要将 Word 文档转换为带有表单域的 PDF。然后可以使用 iText 从我们的 Java 应用程序中轻松填充此 PDF。

我遇到的问题是当我尝试将 Word 文档转换为 PDF 时。我希望将邮件合并字段转换为表单字段,但我尝试过的工具似乎都没有这样做。

我努力了:

  • Microsoft Office 2007 另存为 PDF(仅将 PDF 创建为文本,无表单域)
  • PDFCreator(也只是文本)
  • Docx4j(我将文档保存为 docx,然后转换为 xml),它使用 Apache FOP AFAIK(也只是文本,它显示合并字段,MERGEFIELD "Surname"而其他字段显示<<Surname>>为文档中显示的内容)
  • 我尝试打开在 Scribus 中生成的 PDF,但每次我都收到一个错误,即它的格式不可接受

有谁知道可以做我需要的工具或Java库(最好是免费的)?

0 投票
4 回答
2602 浏览

web-services - 文档格式转换API

我正在寻找一个 RESTful Web 服务,我可以向其发送文档(至少为 doc、docx、xls、xlsx、ppt、pptx 和 tiff)以转换为 pdf 和 swf。

除了 pfd 之外,我还需要 swf 的原因是,我可以使用基于 Flash 的文档查看器(例如FlexPaper )在浏览器中显示文档。

我基本上想要transloadit.com的文件。

一种选择是使用 Scribd API,下载 pdf,然后使用swftools将 pdf 转换为 swf。但是我对替代品感兴趣。

0 投票
1 回答
3011 浏览

java - 将 pdf 转换为 rtf 或 doc

可以使用 java 将 pdf 文档转换为 rtf 或 doc 吗?

0 投票
2 回答
4331 浏览

c# - 在 c# 中将 PDF、Doc 和 Docx 转换为 rtf

我需要一个需要 Doc、Docx 和 PDF 并将它们转换为 RTF 的应用程序。

转换是一种方式,我不需要转换回 Doc 或 PDF。

有没有人这样做过,你能推荐一个库吗?我知道有 aspose,但它很昂贵,而且许可证是每年的,所以这对我碰巧工作的公司不起作用。

如果需要的话,我可以为每种文件类型使用多个库。

提前致谢

0 投票
1 回答
827 浏览

flash - 如何在 flex 应用程序中查看谷歌文档或 word 文件?

我正在为移动和 Web 应用程序评估 flex,我想做的一件事是在 flex 应用程序中显示 google docs 或 microsoft docs 文件(doc、ppt)。

谷歌文档文件作为网页发布,所以我猜你需要一个启用了 javascript 的 html 组件。flex 4+中是否存在这样的组件?

同样,我将如何在 flex 应用程序中显示单词或 powerpoint 文件?像 slideshare 或 scribd 这样的网站是如何做到的?