问题标签 [document-conversion]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
72 浏览

pdf - 如何将自定义页脚添加到 Liferay DocumentConversionUtil(和开放式办公室)创建的 pdf

我正在尝试为我的 liferay6.2 安装中的 docx 文件创建的 pdf 添加自定义页脚。具体来说,我已经链接了开放式办公室,并且我成功地将文档从 docx 转换为 pdf 以将它们嵌入到我的门户中,但我想添加一个“pdf created on”消息作为页脚。

我愿意通过 liferay/java 或通过开放式办公室中的设置来执行此操作,但目前我找不到任何方法。

谢谢,乔

0 投票
1 回答
322 浏览

ibm-watson - 如何在脚本 bash 中使用文档转换服务转换多个文档?

如何使用文档转换服务转换多个文档。

我想要使​​用 convert_documentAPI 方法转换 50-100 个 MS Word 和 PDF 文档?

例如,您可以提供多个这样的 .pdf 或 *.doc 文件吗?:

不幸的是,这给出了一个错误: curl:(26)无法打开文件“* .doc”。我也尝试过“file=@file1.doc,file2.doc,file3.doc”,但这也给出了错误。

0 投票
4 回答
1134 浏览

c# - 以良好的兼容性转换 MS Office Docx

在 StackOverflow 和程序员论坛上花费数小时后,我决定在我们的项目中使用 SyncFusion。我们的主要目标是:

  1. 转换为 PDF/直接打印现有的 Doc 和 Docx
  2. 此文档可能非常复杂(包括形状、图像......)
  3. 使用 Word Interop 对我们来说不是解决方案

如果我们能够毫无问题地转换或打印,则原始 Word 文档的渲染效果不佳(部分形状丢失......)

有人使用这个组件没有问题吗?或者你知道其他最好的组件(Aspose ??)

0 投票
1 回答
209 浏览

curl - Bluemix 文档转换服务 - 如何转换多个文档

我的目标是 JSON 格式的单个文档文件,它来自 50-100 个 MS Word 或 PDF 文档。

有没有办法为“convert_document”命令提供多个文档?我尝试使用 curl 来提供多个 .pdf 或 *.doc 文件,如下所示:

不幸的是,这给了我一个错误:curl: (26) couldn't open file "*.doc" 我也尝试过-F "file=@file1.doc,file2.doc,file3.doc",但这也给出了错误。

0 投票
1 回答
112 浏览

java - 在 Java 中创建用于使用 Document Conversion 和 Concept Insights 的类

因此,由于文档转换,我想制作用于在从 PDF 转换的 HTML 文档上使用 Concept Insights 的类。我正在使用带有 Git 目录视图的 Eclipse IDE。当我运行它时,我没有得到任何响应。我想让它保持整洁,但要确保每种方法都能获得所需的信息。无论如何,这是到目前为止的代码。

0 投票
1 回答
94 浏览

ibm-watson - 从 Bluemix Document Conversion 服务获取神秘错误

我正在尝试将此文档:转换http://www.redbooks.ibm.com/redpapers/pdfs/redp5213.pdf为 JSON 应答单元,但它(以及许多类似的其他)只是不会通过服务进行处理。如果我尝试通过https://document-conversion-demo.mybluemix.net/上的演示页面处理它,它要么返回错误“缺少所需参数:必须指定 params.file 或 params.document_id”,要么只是返回错误返回空白结果。如果我通过 Node.js 和 watson-developer-cloud 通过 REST API 尝试它,它会返回错误代码 400以及消息“输入文档未能转换,因为将 PDF 转换为 HTML 时出现异常”. (为什么它试图转换为 HTML 我不知道 - 我已经指定了 JSON 答案单元,并且这段代码与我尝试过的其他一些文档一起工作得很好)。

我尝试转换的这些红皮书有什么不寻常之处,还是文档转换服务有问题?

0 投票
2 回答
356 浏览

ibm-cloud - 如何在不先将 PDF 写入磁盘的情况下将 PDF 发送到 Watson 的 Document Conversion 服务?

我正在尝试使用watson-developer-cloud node.js 库将此文档 (http://www.redbooks.ibm.com/redbooks/pdfs/ga195486.pdf)转换为回答 Watson 文档转换服务中的单元。

在实际程序(不是这个测试程序)中,我正在检索文档并即时转换它,而不是先将其写入磁盘。我以前用其他文档做过这个,但是最新版本的库(v 1.7.0)似乎已经改变,它不再像我使用它的方式工作了。但即使在我开始使用最新版本之前,这个特定的文档也不会转换。

我正在使用的带注释的测试代码如下。我已经尝试了几种方法来让它工作,它们的变体都在下面的var opts={下注释掉了。您必须一次取消注释其中一个才能查看结果。

有人可以告诉我我做错了什么吗?

0 投票
1 回答
12535 浏览

python - 不是 JSON 可序列化的

按照文档转换 API 示例尝试使用 Flask 将 msword 文档转换为文本,但它不起作用。

这是代码

这是运行时日志

0 投票
1 回答
59 浏览

timeout - pdf 红皮书文件上的 Watson 文档转换服务超时

在以下红皮书上尝试 Watson Document Conversion 服务时:http ://www.redbooks.ibm.com/redbooks/pdfs/ga195486.pdf ,我收到超时错误。我验证大小小于 50 MB。有关如何处理此类文件的任何指导?谢谢你。

0 投票
1 回答
194 浏览

pdf - Bluemix PDF 文档转换

我正在尝试转换 PDF 文档,但我遇到了关于单词重音的问题。PDF 为葡萄牙语-巴西语言。

这是我正在运行的命令:

curl -X POST -u "OMITTED":"OMITTED" -F config="{\"conversion_target\":\"answer_units\"}" -F file=@876.pdf " https://gateway.watsonplatform.net /document-conversion/api/v1/convert_document?version=2015-12-15 "

这是我得到的输出:

带有重音符号的字母全部配置错误。它有什么我可以改变的选项来解决这个问题吗?我已经用多个 PDF 文件进行了测试,它们都给出了相同的结果。

谢谢!