问题标签 [documents4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 远程使用 document4j 将 DOCX 转换为 PDF
我目前正在尝试使用 java 将高级 Word 文档 (.DOCX) 转换为 PDF。
对于 word 文档的生成,我使用的是 apache poi@3.15。他们有一个内置的 PDF 转换器,虽然它有点破坏文档格式。
我最终最终使用了基于云的 API(付费),感觉很糟糕。不过今天,我发现了 document4j 项目,这让我非常兴奋。
我购买了一个运行 windows 的 VPS,其唯一目的是将 .docx 文件转换为 .pdf 文件,并且它是可以访问的。document4j/local-demo 也运行良好,能够很好地将我的 .docx 文件转换为 .pdf。
不过,在线文档似乎非常有限,除了 Javadocs,它对我的帮助比在我的编辑器中的智能感知更重要。
有人可以帮我解决这个问题吗?
堆栈跟踪
pom.xml
相关代码:
编辑:使用java -jar ./documents4j-client-standalone-1.0.3-shaded.jar http://xxx.xxx.xxx.xxx:1337
作品,但不幸的是不是在java代码本身。
java - Documents4j remoteServer 转换服务器设置
我正在使用 Documents4j 将 rtf 文件转换为 pdf 文件。我的电脑上没有 MS Word 或任何东西,所以看来我需要使用远程转换器。这里的信息:http ://documents4j.com/#/ 。
我的项目是使用 spring-boot 设置的。根据 GitHub 上的一些问题,我使用 maven-shade-plugin 为 maven 设置了阴影。但是,我无法运行 Documents4j 建议的让服务器运行的命令:
java -jar documents4j-server-standalone-shaded.jar http://localhost:9998
我得到:
Error: Unable to access jarfile documents4j-server-standalone-shaded.jar
。
我的 pom.xml 文件引入了 shade 插件。
这是我的 pom.xml 中的插件:
以下是我使用的关于 Documents4j 的依赖项:(也许缺少一些重要的东西?)
根据我在 Documents4j 页面上阅读的内容,该命令似乎应该可以正常工作,因此我假设没有创建 jar 文件。
我似乎无法在任何地方找到该 jarfile ......所以我无法使用路径而不是名称来运行 java -jar 命令。
另外,我不确定插件中可能需要什么“配置”。也许有一个技巧可以让 maven 着色工作?也许我误解了 Documents4j 页面在说什么?也许它对 Mac 的工作方式不同?也许 Documents4j 不是一个好的选择?
我非常感谢所有的帮助。
java - 没有 Microsoft Word,documents4j 转换为 pdf 不起作用?
我想使用documents4j将docx文件转换为pdf,但我不想使用MS word
有没有其他解决方案?
我使用了 Apache poi,但它在波斯语中无法正常工作
我的错误:
java - 创建word文件的进程超时异常
我使用documents4j 库创建了一个word 文件。
有时它可以工作,但有时它不起作用并经历超时异常。
以下是输出错误:
我该如何解决这个错误?
java - Documents4j Remote Converter:生成的 Pdf 文件损坏,无法打开
我尝试通过以下代码将一个简单的 docx 文件转换为 PDF:
一切似乎都正常,我的 docx 是一个简单的文件,里面有“测试”,但是当我试图打开生成的 PDF 时,它被破坏了一些,我不知道为什么......
java - 如何使用开源 Java 库正确地将 DOCM 转换为 PDF?
我开始研究如何将.docm文件转换为 PDF 文件。据我所知,只有将 .docx 转换为 pdf 的开源库。我的解决方案是寻找一种将 .docm 转换为 .docx 的方法,同时保留所有信息。为此,我找不到合适的开源解决方案,但我找到了 apache-poi 的提交(链接)。使用在该提交中找到的代码,我设法使用我的 .docm 文件所具有的所有信息创建了 .docx 文件。
我从链接中复制了代码并以上述方式使用它。
获得包含所有信息的 .docx 文件后,我开始将它们转换为 .pdf 文件。为此,我找到了 2 个可能的开源库,docx4j和documents4j。
Docx4j 转换为 pdf 代码:
这将为我生成一个 pdf 文件,其中包含除 MS Word 的注释之外的所有信息。
Documents4j 转换为 pdf 代码:
这将为我生成一个看起来不错的 pdf 文件,其中包含 MS Word 的注释。
进一步的测试表明 docx4j pdf 在文本中是准确的,但位置发生了变化(例如:段落合并或分成两部分)。来自documents4j 的PDF 在位置上更准确,但就像我说的那样,它们缺少信息。我的测试是在以相同方式创建的表单文档上进行的,丢失的信息总是在同一个地方。
我的问题如下:
- 是否有经过认证的方法可以使用开源库将 .docm 文件正确转换为 .docx 文件?
- 当我使用documents4j创建pdf时出了什么问题?
- 如何在 docx4j 的帮助下包含 MS Word 的评论?
- 我选择的图书馆有其他选择吗?(仅限开源)
编辑:我忘了包括我正在使用每个库的最新版本。
documents4j - documents4j xls xlsx 日期转换
当使用documents4j从xls转换为xlsx时,包含类型为dd-mmm-yyyy的自定义类别日期格式的列被转换为数值 - 在我的例子中,xls doc中的24-Nov-1990变成了33201 xlsx 文档。关于如何纠正这个问题的任何想法?我使用的是 1.1.3 版。
当我使用 POI 读取可比较的值时,我在另一个应用程序中遇到了类似的问题。我首先必须检查该列是否为数字并且具有日期格式,如果是,则获取日期值。
文档4j代码:
谢谢你,查尔斯·哈维
java - 为什么在spring mvc项目中使用documents4j库时要注销
我使用 Spring MVC Web 项目,将 docx 文件转换为 pdf 时需要documents4j 库。Documents4j 可以正确地将 docx 转换为 pdf,但随后我的网络会话被注销。有谁知道为什么?
我正在使用 Spring mvc web 结构,我需要为 docx 转换 pdf 的documents4j。我用来转换的代码:
我正在使用以下依赖项;
我的输出: