问题标签 [documents4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
557 浏览

java - 无法创建 MicrosoftWordBridge - Documents4j

我有这个问题。

笔记:

  • 已安装 MS Office
  • PDF/XPS 插件安装在 MS Office 中。

我的代码:

请。我该如何解决这个错误?

项目中的罐子

0 投票
2 回答
1746 浏览

java - 远程使用 document4j 将 DOCX 转换为 PDF

我目前正在尝试使用 java 将高级 Word 文档 (.DOCX) 转换为 PDF。

对于 word 文档的生成,我使用的是 apache poi@3.15。他们有一个内置的 PDF 转换器,虽然它有点破坏文档格式。

我最终最终使用了基于云的 API(付费),感觉很糟糕。不过今天,我发现了 document4j 项目,这让我非常兴奋。

我购买了一个运行 windows 的 VPS,其唯一目的是将 .docx 文件转换为 .pdf 文件,并且它是可以访问的。document4j/local-demo 也运行良好,能够很好地将我的 .docx 文件转换为 .pdf。

不过,在线文档似乎非常有限,除了 Javadocs,它对我的​​帮助比在我的编辑器中的智能感知更重要。

有人可以帮我解决这个问题吗?

堆栈跟踪

pom.xml

相关代码:

编辑:使用java -jar ./documents4j-client-standalone-1.0.3-shaded.jar http://xxx.xxx.xxx.xxx:1337作品,但不幸的是不是在java代码本身。

0 投票
1 回答
887 浏览

java - Documents4j remoteServer 转换服务器设置

我正在使用 Documents4j 将 rtf 文件转换为 pdf 文件。我的电脑上没有 MS Word 或任何东西,所以看来我需要使用远程转换器。这里的信息:http ://documents4j.com/#/ 。

我的项目是使用 spring-boot 设置的。根据 GitHub 上的一些问题,我使用 maven-shade-plugin 为 maven 设置了阴影。但是,我无法运行 Documents4j 建议的让服务器运行的命令: java -jar documents4j-server-standalone-shaded.jar http://localhost:9998

我得到: Error: Unable to access jarfile documents4j-server-standalone-shaded.jar

我的 pom.xml 文件引入了 shade 插件。

这是我的 pom.xml 中的插件:

以下是我使用的关于 Documents4j 的依赖项:(也许缺少一些重要的东西?)

根据我在 Documents4j 页面上阅读的内容,该命令似乎应该可以正常工作,因此我假设没有创建 jar 文件。

我似乎无法在任何地方找到该 jarfile ......所以我无法使用路径而不是名称来运行 java -jar 命令。

另外,我不确定插件中可能需要什么“配置”。也许有一个技巧可以让 maven 着色工作?也许我误解了 Documents4j 页面在说什么?也许它对 Mac 的工作方式不同?也许 Documents4j 不是一个好的选择?

我非常感谢所有的帮助。

0 投票
1 回答
1638 浏览

java - 没有 Microsoft Word,documents4j 转换为 pdf 不起作用?

我想使用documents4j将docx文件转换为pdf,但我不想使用MS word

有没有其他解决方案?

我使用了 Apache poi,但它在波斯语中无法正常工作

我的错误:

0 投票
1 回答
255 浏览

java - 创建word文件的进程超时异常

我使用documents4j 库创建了一个word 文件。

有时它可以工作,但有时它不起作用并经历超时异常。

以下是输出错误:

我该如何解决这个错误?

0 投票
1 回答
286 浏览

java - Documents4j Remote Converter:生成的 Pdf 文件损坏,无法打开

我尝试通过以下代码将一个简单的 docx 文件转换为 PDF:

一切似乎都正常,我的 docx 是一个简单的文件,里面有“测试”,但是当我试图打开生成的 PDF 时,它被破坏了一些,我不知道为什么......

0 投票
1 回答
607 浏览

java - 如何使用开源 Java 库正确地将 DOCM 转换为 PDF?

我开始研究如何将.docm文件转换为 PDF 文件。据我所知,只有将 .docx 转换为 pdf 的开源库。我的解决方案是寻找一种将 .docm 转换为 .docx 的方法,同时保留所有信息。为此,我找不到合适的开源解决方案,但我找到了 apache-poi 的提交(链接)。使用在该提交中找到的代码,我设法使用我的 .docm 文件所具有的所有信息创建了 .docx 文件。

我从链接中复制了代码并以上述方式使用它。

获得包含所有信息的 .docx 文件后,我开始将它们转换为 .pdf 文件。为此,我找到了 2 个可能的开源库,docx4jdocuments4j

Docx4j 转换为 pdf 代码:

这将为我生成一个 pdf 文件,其中包含除 MS Word 的注释之外的所有信息。

Documents4j 转换为 pdf 代码:

这将为我生成一个看起来不错的 pdf 文件,其中包含 MS Word 的注释。

进一步的测试表明 docx4j pdf 在文本中是准确的,但位置发生了变化(例如:段落合并或分成两部分)。来自documents4j 的PDF 在位置上更准确,但就像我说的那样,它们缺少信息。我的测试是在以相同方式创建的表单文档上进行的,丢失的信息总是在同一个地方。

我的问题如下:

  1. 是否有经过认证的方法可以使用开源库将 .docm 文件正确转换为 .docx 文件?
  2. 当我使用documents4j创建pdf时出了什么问题?
  3. 如何在 docx4j 的帮助下包含 MS Word 的评论?
  4. 我选择的图书馆有其他选择吗?(仅限开源)

编辑:我忘了包括我正在使用每个库的最新版本。

0 投票
3 回答
549 浏览

java - 线程“main”java.lang.Error 中的异常:未解决的编译问题:无法解决 LocalConverter

我正在尝试使用documents4j 1.0.3.jar将Docx文件转换为java中的pdf文件,但我无法转换它。看了一些参考,大家建议在maven项目中做pom文件依赖。我们不是 maven 项目,我只希望在添加了 jar 文件的 java 项目中解决方案。

代码 :

在此处输入图像描述

0 投票
1 回答
32 浏览

documents4j - documents4j xls xlsx 日期转换

当使用documents4j从xls转换为xlsx时,包含类型为dd-mmm-yyyy的自定义类别日期格式的列被转换为数值 - 在我的例子中,xls doc中的24-Nov-1990变成了33201 xlsx 文档。关于如何纠正这个问题的任何想法?我使用的是 1.1.3 版。

当我使用 POI 读取可比较的值时,我在另一个应用程序中遇到了类似的问题。我首先必须检查该列是否为数字并且具有日期格式,如果是,则获取日期值。

文档4j代码:

谢谢你,查尔斯·哈维

0 投票
0 回答
79 浏览

java - 为什么在spring mvc项目中使用documents4j库时要注销

我使用 Spring MVC Web 项目,将 docx 文件转换为 pdf 时需要documents4j 库。Documents4j 可以正确地将 docx 转换为 pdf,但随后我的网络会话被注销。有谁知道为什么?

我正在使用 Spring mvc web 结构,我需要为 docx 转换 pdf 的documents4j。我用来转换的代码:

我正在使用以下依赖项;

我的输出: