问题标签 [docx4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3049 浏览

java - 如何在 docx4j 中的 addParagraphOfText 上设置空间?

添加到 MainDocumentPart 后,有什么方法可以更改段落的任何属性?

在最后一行中,我想使用 setSpace("preserve") 保留空白,但是如何?

谢谢,龙萨克

0 投票
1 回答
1167 浏览

android - 使用 docx4j 将 pptx 转换为 html 视图

任何人都可以帮助我使用 docx4j.jar 将 pptx 转换为 html 视图。虽然我已经在这个论坛上经历了很多相关的问题,但没有一个对我有帮助。请给我一个简短的转换过程(只需命名相关的类及其要调用的方法)。好吧,我在我的“Android”应用程序中做这一切,不想要任何第三方软件(只需要在我的应用程序中打开 pptx)。

0 投票
1 回答
3335 浏览

java - POI 或 docx4j 可以读取受密码保护的 Word 文档吗?

我遇到了 POI 问题,需要一些帮助。

我有一个个人日记,我已经保存了多年,每月将每日条目写入一个 Word .doc,存储在 year 文件夹中。我添加了一个密码来打开每一个,所以它们都是加密的。

我想使用 Lucene 来索引整个集合,以便更好地搜索(例如,“我最后一次在哪一天和哪一年写​​下我有多喜欢燕麦片?”)。

第一步是使用 POI 读取 Word .doc,但我无法摆脱困境,因为它无法读取我的加密文件。

我写了这个类:

我有一个 JUnit 测试来尝试一下:

当我运行 JUnit 测试时,我得到了这个堆栈跟踪:

POI 文档和 javadocs 一直没用。在考虑切换到 docx4j 的地方,我感到非常沮丧。这意味着将我所有的 .doc 文件转换为 .docx(当然,在适当的备份之后)。

我想知道是否有人成功使用 docx4j 读取加密的、受密码保护的文件。任何人?我只想得到一个肯定的答案,告诉我值得继续努力。

如果有人能看到我在 POI 上做错了什么,我也会很高兴知道这一点。谢谢。

0 投票
2 回答
9003 浏览

java - 使用 docx4j 转换 docx -> pdf 时如何更改字体编码?

当我将 docx 文档转换为 pdf 时,我的国家字符转换为“#”标记。
有没有办法为pdf文档设置字体编码?

我过去使用过 xdocreport,它可以处理这个问题,但我在图像、页眉和页脚方面遇到了问题。

Docx4j 设法做到这一点,但不是字体。转换后,字体有 ANSI 编码,而我想有 windows-1250。有没有设置这个选项?

0 投票
1 回答
3550 浏览

docx4j - 使用 docx4j 从 Word 文档中解析内容

感谢之前的回答,我现在可以阅读受密码保护的 Word 2010 文档。(我必须将它们从 .doc 一个一个翻译成 .docx。它们可以追溯到 1994 年,但没关系。)

我写了一个简单的 Java 类来开始:

还有一个 JUnit 测试来驱动它:

我在测试中设置了一个断点,以查看 docx4j 在读取我的文档后在做什么。我看到一个包含 8 个部分的列表,但我穿过树而没有找到内容。

每个文档都包含一个带有日期和内容的页面,但我找不到页面。他们住在哪里?

0 投票
1 回答
2704 浏览

java - docx4j:“没有合适的 JAXB 实现可用”运行时错误 Java 1.5

我正在使用 docx4j 来解析 docx 文件。我从 docx4j 站点docx4j downloads下载了所有 JAR 。

当我在代码中使用它时,它会在代码的第一行给出运行时错误:-

例外是:

0 投票
1 回答
1316 浏览

docx4j - docx4j 支持的 XHTML 标签列表

是否有一个列表显示 docx4j XHTML 导入器支持哪些 XHTML 标记和 CSS 属性?
谢谢。

0 投票
3 回答
6792 浏览

java - jar运行时如何防止InvocationTargetException?

我遇到了一个奇怪的(至少对我来说)案例。当我从 Eclipse 运行我的项目时,一切都很好。但是,当我将项目导出到 jar 文件时,它会因InvocationTargetException而失败。我正在使用其他外部库,一切运行良好(程序运行时间约为 5 分钟),最后会创建一个 docx。

我在 cmd 中运行,它打印:

线程“主”java.lang.reflect.InvocationTargetException 中的异常

引起:java.lang.ExceptionInInitializerError

在 com.lesswire.wita.Wita.CreateReport(Wita.java:1320)

我怎样才能让它在我的罐子里工作?

谢谢,龙萨克

0 投票
2 回答
3814 浏览

out-of-memory - 使用 Docx4j 和 PdfBox 将 Docx 转换为图像会导致 OutOfMemoryError

我正在使用 dox4j 和 pdfbox 分两步将 docx 文件的第一页转换为图像,但我目前OutOfMemoryError每次都得到一个。

我已经能够确定在该过程的最后一步引发了异常,而该convertToImage方法正在被调用,但是我一直在使用该方法的第二步来转换 pdf 一段时间没有问题所以我不知道可能是什么原因,除非 dox4j 正在编码 pdf 是一种我尚未测试或已损坏的方式。

我试过用ByteArrayOutputStreama替换FileOutputStreampdf 似乎正确渲染并不比我预期的要大。

这是我正在使用的代码:

编辑 为了在这种情况下提供更多上下文,此代码正在 grails web 应用程序中运行。我尝试了该代码的几种不同变体,包括将不再需要的所有内容清空,使用 FileInputStream 和 FileOutputStream 来尝试节省更多物理内存并检查 docx4j 和 pdfbox 的输出,它们似乎都可以正常工作。

我正在使用 docx4j 2.8.1 和 pdfbox 0.7.3,我也尝试过 pdf-renderer,但仍然出现 OutOfMemoryError。我的怀疑是 docx4j 使用了太多内存,但在 pdf 到图像转换之前不会产生错误。

我很乐意将 docx 文件转换为 pdf 或直接转换为图像作为答案的另一种方法,但是我目前正在尝试替换在服务器上运行有问题的 jodconverter。

0 投票
1 回答
3825 浏览

java - Docx4j 以编程方式添加 w:sdt 内容控件

我正在构建一个小型 java 程序来测试我需要用 docx4j 覆盖的所有“文档相关”功能,以满足我的项目要求。摘要:能够创建带有“内容控件”的模板,这些模板将作为“原始模板”提供给用户。让用户增强它们,最终用数据填充它们。由于“重复和条件”功能,我正在处理“docx4j”。

这是我的进步,以编程方式:

1)创建一个空白文档(完成)

2) 添加带有 xml 数据的自定义 xml 部件(发票示例中的 part3.xml)。(完毕)

3) 添加带有 xml xpaths 参考的自定义 xml 部件(发票示例中的 part4.xml)。(完毕)

4)添加内容控件(PENDING)

它必须类似于发票示例中的以下摘录:

这是我的问题:如何生成这个 xml ?可以通过 Java 代码完成还是只能从 Word 完成?“1418037941”和“DefaultPlaceholder_22675703”值是什么以及如何生成的?我想我不能“发明”它们,并在其他地方被引用。我正在 MainDocumentPart 类中寻找一些方法来执行此操作,但找不到它。我误解了什么吗?

其他步骤对我来说几乎没问题:

5)执行“预处理”(完成)

6)执行“过程”(完成)

7)执行“strip”(完成,除了删除repat标签)

非常感谢您的帮助!大卫