问题标签 [document-conversion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
664 浏览

html - A.nnotate.com 背后使用了什么技术?

我想知道 A.nnotate.com、Scribd、Google Docs 等服务如何将 pdf、.doc 或任何其他文档呈现为 HTML 以及注释系统如何工作?

0 投票
3 回答
5376 浏览

solr - 用于在 Solr 中解析 PDF 的 Tika/PDFBox 替代方案(任何高于 1.4 的版本)

似乎 Solr 没有正确解析我的 PDF 文件。我想知道使用 Apache Tika(我相信它在内部使用 PDFBox)来解析 PDF 文件是否还有其他选择?使用它时,我的内容之间似乎出现了随机空格。我已经通过直接通过 PDFBox 运行 PDF(最新版本)来隔离问题,这有同样的问题。

一些 OCR 商业软件(例如 Omnifind)在 PDF 上运行良好,但我们无法以相同的方式将它们与 Solr 集成,购买也不是一种选择。

0 投票
3 回答
3404 浏览

java - 将 PDF 文件转换为单个 HTML 文件

我正在尝试将 PDF 文档转换为 java 中的单个 HTML 文件。大多数在线转换器将一个 PDF 文件转换为多个 HTML 文件。我想将整个 PDF 转换为单个 HTML 文件。

有什么建议么?

0 投票
3 回答
3986 浏览

php - 他们是否有任何免费的 PHP 库可以将 PPT 或 ODT 转换为 PDF

我正在使用共享主机帐户(linux)上的文档管理器,我也没有命令行访问权限。

当人们上传演示文稿时,我需要将它们转换为 PDF 供人们下载。我已经读到有一种方法可以通过安装无头开放式办公室来做到这一点,但我无法在这台服务器上做到这一点。

有没有可以管理文档转换的免费 php 库?

干杯!

0 投票
2 回答
18898 浏览

pdf - 将多页 PDF 转换为多页 TIFF 的工具

我正在编写一个小型应用程序来将多个多页 PDF 转换为多页 TIFF 文件。根据该站点上的其他问题和答案,我已经尝试了 ghostscript 和 ImageMagick,但是这两个软件在我运行它们时只会隐藏第一页。是否有任何其他工具可以用来完成此任务,最好是开源工具?

0 投票
0 回答
1054 浏览

html - 用于移动应用的开源 html5 文档查看器

我正在使用 Phonegap 为 Android 和 iOS 平台构建移动应用程序。我想使用html5 文档查看器在移动应用程序中显示pdf、ppt和所有内容。

我看到了鳄鱼。它很好,但我需要一些我可以修补的开源。

您能否建议目前是否有任何开源解决方案可以在移动应用程序中显示文档?

0 投票
5 回答
1975 浏览

pdf - 用于将 TIFF 批量转换为可索引 PDF 的命令行软件

我需要一个实用程序来将 TIFF 文件批量转换为可索引的 PDF。该软件需要在 linux 上运行,并且必须从命令行运行。该软件不需要是开源的。我已经尝试使用 tesseract 和 hocr2pdf 进行转换,但是它们会生成带有乱码文本的 PDF(注意:只有在 PDF 中“全选”文本时,文本才会出现乱码)。我找到了其他实用程序,但它们只能在 Windows 下运行,或者不能从命令行运行。提前致谢。

0 投票
1 回答
1465 浏览

ms-word - 在 Java 中将 Microsoft Word 转换为 PDF 的最佳方法是哪种(JODConverter+open Office 或 Apache POI HWPF+iText)?

在我的应用程序中,当客户状态发生变化时,我必须向客户发送自动电子邮件。我需要在该电子邮件中附加一份文件,该文件应为 pdf 格式。我必须从现有的 word 文档创建这个附加的 PDF 文档。作为Apache Open Office是安装程序,每次我想转换文档时都必须作为服务启动HWPF + iText 。请建议我使用哪个。

0 投票
3 回答
255 浏览

c# - 将日期从 Visual Basic 转换为 C-Sharp

因此,作为实用程序的练习,我自己承担了将我们可怜的旧 vb .net 1.1 应用程序之一转换为 C# .net 4.0 的任务。

我使用Telerik 代码转换作为起点,最终出现约 150 个错误(考虑到其超过 20k 的代码,这还不算太糟糕,而且我很少能使用生产源代码让它在没有错误的情况下运行)其中许多处理时间/日期在 vb 与 c# 中。

我的问题是,您将如何在 VB 中表示以下语句

在 C# 中?转换器给了我

这当然是不正确的,但我似乎无法弄清楚如何使它正确。

0 投票
1 回答
265 浏览

node.js - 如何使用 node.js 制作将文档转换为演示文稿的服务

我想制作一个将文档转换为 ppt 演示文稿的 node.js 服务器。我想我会使用 Open Office 来完成这项工作,但我不确定如何开始,以及是否有人可以帮助我指出一个好的方向,也许还有一些关于如何使用 Open Office 的教程可能会用其他编程语言。