“docx4j”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

3049 浏览

java - 如何在 docx4j 中的 addParagraphOfText 上设置空间？

添加到 MainDocumentPart 后，有什么方法可以更改段落的任何属性？

在最后一行中，我想使用 setSpace("preserve") 保留空白，但是如何？

谢谢，龙萨克

2012-08-16T06:43:43.560

0 投票

1 回答

1167 浏览

android - 使用 docx4j 将 pptx 转换为 html 视图

任何人都可以帮助我使用 docx4j.jar 将 pptx 转换为 html 视图。虽然我已经在这个论坛上经历了很多相关的问题，但没有一个对我有帮助。请给我一个简短的转换过程（只需命名相关的类及其要调用的方法）。好吧，我在我的“Android”应用程序中做这一切，不想要任何第三方软件（只需要在我的应用程序中打开 pptx）。

android powerpoint file-conversion docx4j

2012-08-22T05:39:07.270

0 投票

1 回答

3335 浏览

java - POI 或 docx4j 可以读取受密码保护的 Word 文档吗？

我遇到了 POI 问题，需要一些帮助。

我有一个个人日记，我已经保存了多年，每月将每日条目写入一个 Word .doc，存储在 year 文件夹中。我添加了一个密码来打开每一个，所以它们都是加密的。

我想使用 Lucene 来索引整个集合，以便更好地搜索（例如，“我最后一次在哪一天和哪一年写下我有多喜欢燕麦片？”）。

第一步是使用 POI 读取 Word .doc，但我无法摆脱困境，因为它无法读取我的加密文件。

我写了这个类：

我有一个 JUnit 测试来尝试一下：

当我运行 JUnit 测试时，我得到了这个堆栈跟踪：

POI 文档和 javadocs 一直没用。在考虑切换到 docx4j 的地方，我感到非常沮丧。这意味着将我所有的 .doc 文件转换为 .docx（当然，在适当的备份之后）。

我想知道是否有人成功使用 docx4j 读取加密的、受密码保护的文件。任何人？我只想得到一个肯定的答案，告诉我值得继续努力。

如果有人能看到我在 POI 上做错了什么，我也会很高兴知道这一点。谢谢。

java apache-poi docx4j

2012-08-23T22:12:31.960

0 投票

2 回答

9003 浏览

java - 使用 docx4j 转换 docx -> pdf 时如何更改字体编码？

当我将 docx 文档转换为 pdf 时，我的国家字符转换为“#”标记。
有没有办法为pdf文档设置字体编码？

我过去使用过 xdocreport，它可以处理这个问题，但我在图像、页眉和页脚方面遇到了问题。

Docx4j 设法做到这一点，但不是字体。转换后，字体有 ANSI 编码，而我想有 windows-1250。有没有设置这个选项？

java pdf docx docx4j xdocreport

2012-09-08T04:17:27.763

0 投票

1 回答

3550 浏览

docx4j - 使用 docx4j 从 Word 文档中解析内容

感谢之前的回答，我现在可以阅读受密码保护的 Word 2010 文档。（我必须将它们从 .doc 一个一个翻译成 .docx。它们可以追溯到 1994 年，但没关系。）

我写了一个简单的 Java 类来开始：

还有一个 JUnit 测试来驱动它：

我在测试中设置了一个断点，以查看 docx4j 在读取我的文档后在做什么。我看到一个包含 8 个部分的列表，但我穿过树而没有找到内容。

每个文档都包含一个带有日期和内容的页面，但我找不到页面。他们住在哪里？

docx4j word-2010

2012-09-08T23:33:26.350

0 投票

1 回答

2704 浏览

java - docx4j：“没有合适的 JAXB 实现可用”运行时错误 Java 1.5

我正在使用 docx4j 来解析 docx 文件。我从 docx4j 站点docx4j downloads下载了所有 JAR 。

当我在代码中使用它时，它会在代码的第一行给出运行时错误：-

例外是：

java jaxb docx4j

2012-09-11T05:18:11.780

0 投票

1 回答

1316 浏览

docx4j - docx4j 支持的 XHTML 标签列表

是否有一个列表显示 docx4j XHTML 导入器支持哪些 XHTML 标记和 CSS 属性？
谢谢。

docx4j

2012-09-16T11:16:35.380

0 投票

3 回答

6792 浏览

java - jar运行时如何防止InvocationTargetException？

我遇到了一个奇怪的（至少对我来说）案例。当我从 Eclipse 运行我的项目时，一切都很好。但是，当我将项目导出到 jar 文件时，它会因InvocationTargetException而失败。我正在使用其他外部库，一切运行良好（程序运行时间约为 5 分钟），最后会创建一个 docx。

我在 cmd 中运行，它打印：

线程“主”java.lang.reflect.InvocationTargetException 中的异常

引起：java.lang.ExceptionInInitializerError

在 com.lesswire.wita.Wita.CreateReport(Wita.java:1320)

我怎样才能让它在我的罐子里工作？

谢谢，龙萨克

java eclipse docx4j invocationtargetexception

2012-09-21T08:22:14.530

0 投票

2 回答

3814 浏览

out-of-memory - 使用 Docx4j 和 PdfBox 将 Docx 转换为图像会导致 OutOfMemoryError

我正在使用 dox4j 和 pdfbox 分两步将 docx 文件的第一页转换为图像，但我目前OutOfMemoryError每次都得到一个。

我已经能够确定在该过程的最后一步引发了异常，而该convertToImage方法正在被调用，但是我一直在使用该方法的第二步来转换 pdf 一段时间没有问题所以我不知道可能是什么原因，除非 dox4j 正在编码 pdf 是一种我尚未测试或已损坏的方式。

我试过用ByteArrayOutputStreama替换FileOutputStreampdf 似乎正确渲染并不比我预期的要大。

这是我正在使用的代码：

编辑为了在这种情况下提供更多上下文，此代码正在 grails web 应用程序中运行。我尝试了该代码的几种不同变体，包括将不再需要的所有内容清空，使用 FileInputStream 和 FileOutputStream 来尝试节省更多物理内存并检查 docx4j 和 pdfbox 的输出，它们似乎都可以正常工作。

我正在使用 docx4j 2.8.1 和 pdfbox 0.7.3，我也尝试过 pdf-renderer，但仍然出现 OutOfMemoryError。我的怀疑是 docx4j 使用了太多内存，但在 pdf 到图像转换之前不会产生错误。

我很乐意将 docx 文件转换为 pdf 或直接转换为图像作为答案的另一种方法，但是我目前正在尝试替换在服务器上运行有问题的 jodconverter。

out-of-memory pdfbox docx4j

2012-10-12T00:49:50.610

0 投票

1 回答

3825 浏览

java - Docx4j 以编程方式添加 w:sdt 内容控件

我正在构建一个小型 java 程序来测试我需要用 docx4j 覆盖的所有“文档相关”功能，以满足我的项目要求。摘要：能够创建带有“内容控件”的模板，这些模板将作为“原始模板”提供给用户。让用户增强它们，最终用数据填充它们。由于“重复和条件”功能，我正在处理“docx4j”。

这是我的进步，以编程方式：

1）创建一个空白文档（完成）

2) 添加带有 xml 数据的自定义 xml 部件（发票示例中的 part3.xml）。（完毕）

3) 添加带有 xml xpaths 参考的自定义 xml 部件（发票示例中的 part4.xml）。（完毕）

4）添加内容控件（PENDING）

它必须类似于发票示例中的以下摘录：

这是我的问题：如何生成这个 xml ？可以通过 Java 代码完成还是只能从 Word 完成？“1418037941”和“DefaultPlaceholder_22675703”值是什么以及如何生成的？我想我不能“发明”它们，并在其他地方被引用。我正在 MainDocumentPart 类中寻找一些方法来执行此操作，但找不到它。我误解了什么吗？

其他步骤对我来说几乎没问题：

5）执行“预处理”（完成）

6）执行“过程”（完成）

7）执行“strip”（完成，除了删除repat标签）

非常感谢您的帮助！大卫

java ms-word openxml docx docx4j

2012-10-15T20:51:26.447

问题标签 [docx4j]

Reference