问题标签 [docx4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 如何在 docx4j 中的 addParagraphOfText 上设置空间?
添加到 MainDocumentPart 后,有什么方法可以更改段落的任何属性?
在最后一行中,我想使用 setSpace("preserve") 保留空白,但是如何?
谢谢,龙萨克
android - 使用 docx4j 将 pptx 转换为 html 视图
任何人都可以帮助我使用 docx4j.jar 将 pptx 转换为 html 视图。虽然我已经在这个论坛上经历了很多相关的问题,但没有一个对我有帮助。请给我一个简短的转换过程(只需命名相关的类及其要调用的方法)。好吧,我在我的“Android”应用程序中做这一切,不想要任何第三方软件(只需要在我的应用程序中打开 pptx)。
java - POI 或 docx4j 可以读取受密码保护的 Word 文档吗?
我遇到了 POI 问题,需要一些帮助。
我有一个个人日记,我已经保存了多年,每月将每日条目写入一个 Word .doc,存储在 year 文件夹中。我添加了一个密码来打开每一个,所以它们都是加密的。
我想使用 Lucene 来索引整个集合,以便更好地搜索(例如,“我最后一次在哪一天和哪一年写下我有多喜欢燕麦片?”)。
第一步是使用 POI 读取 Word .doc,但我无法摆脱困境,因为它无法读取我的加密文件。
我写了这个类:
我有一个 JUnit 测试来尝试一下:
当我运行 JUnit 测试时,我得到了这个堆栈跟踪:
POI 文档和 javadocs 一直没用。在考虑切换到 docx4j 的地方,我感到非常沮丧。这意味着将我所有的 .doc 文件转换为 .docx(当然,在适当的备份之后)。
我想知道是否有人成功使用 docx4j 读取加密的、受密码保护的文件。任何人?我只想得到一个肯定的答案,告诉我值得继续努力。
如果有人能看到我在 POI 上做错了什么,我也会很高兴知道这一点。谢谢。
java - 使用 docx4j 转换 docx -> pdf 时如何更改字体编码?
当我将 docx 文档转换为 pdf 时,我的国家字符转换为“#”标记。
有没有办法为pdf文档设置字体编码?
我过去使用过 xdocreport,它可以处理这个问题,但我在图像、页眉和页脚方面遇到了问题。
Docx4j 设法做到这一点,但不是字体。转换后,字体有 ANSI 编码,而我想有 windows-1250。有没有设置这个选项?
docx4j - 使用 docx4j 从 Word 文档中解析内容
感谢之前的回答,我现在可以阅读受密码保护的 Word 2010 文档。(我必须将它们从 .doc 一个一个翻译成 .docx。它们可以追溯到 1994 年,但没关系。)
我写了一个简单的 Java 类来开始:
还有一个 JUnit 测试来驱动它:
我在测试中设置了一个断点,以查看 docx4j 在读取我的文档后在做什么。我看到一个包含 8 个部分的列表,但我穿过树而没有找到内容。
每个文档都包含一个带有日期和内容的页面,但我找不到页面。他们住在哪里?
docx4j - docx4j 支持的 XHTML 标签列表
是否有一个列表显示 docx4j XHTML 导入器支持哪些 XHTML 标记和 CSS 属性?
谢谢。
java - jar运行时如何防止InvocationTargetException?
我遇到了一个奇怪的(至少对我来说)案例。当我从 Eclipse 运行我的项目时,一切都很好。但是,当我将项目导出到 jar 文件时,它会因InvocationTargetException而失败。我正在使用其他外部库,一切运行良好(程序运行时间约为 5 分钟),最后会创建一个 docx。
我在 cmd 中运行,它打印:
线程“主”java.lang.reflect.InvocationTargetException 中的异常
引起:java.lang.ExceptionInInitializerError
在 com.lesswire.wita.Wita.CreateReport(Wita.java:1320)
我怎样才能让它在我的罐子里工作?
谢谢,龙萨克
out-of-memory - 使用 Docx4j 和 PdfBox 将 Docx 转换为图像会导致 OutOfMemoryError
我正在使用 dox4j 和 pdfbox 分两步将 docx 文件的第一页转换为图像,但我目前OutOfMemoryError
每次都得到一个。
我已经能够确定在该过程的最后一步引发了异常,而该convertToImage
方法正在被调用,但是我一直在使用该方法的第二步来转换 pdf 一段时间没有问题所以我不知道可能是什么原因,除非 dox4j 正在编码 pdf 是一种我尚未测试或已损坏的方式。
我试过用ByteArrayOutputStream
a替换FileOutputStream
pdf 似乎正确渲染并不比我预期的要大。
这是我正在使用的代码:
编辑 为了在这种情况下提供更多上下文,此代码正在 grails web 应用程序中运行。我尝试了该代码的几种不同变体,包括将不再需要的所有内容清空,使用 FileInputStream 和 FileOutputStream 来尝试节省更多物理内存并检查 docx4j 和 pdfbox 的输出,它们似乎都可以正常工作。
我正在使用 docx4j 2.8.1 和 pdfbox 0.7.3,我也尝试过 pdf-renderer,但仍然出现 OutOfMemoryError。我的怀疑是 docx4j 使用了太多内存,但在 pdf 到图像转换之前不会产生错误。
我很乐意将 docx 文件转换为 pdf 或直接转换为图像作为答案的另一种方法,但是我目前正在尝试替换在服务器上运行有问题的 jodconverter。
java - Docx4j 以编程方式添加 w:sdt 内容控件
我正在构建一个小型 java 程序来测试我需要用 docx4j 覆盖的所有“文档相关”功能,以满足我的项目要求。摘要:能够创建带有“内容控件”的模板,这些模板将作为“原始模板”提供给用户。让用户增强它们,最终用数据填充它们。由于“重复和条件”功能,我正在处理“docx4j”。
这是我的进步,以编程方式:
1)创建一个空白文档(完成)
2) 添加带有 xml 数据的自定义 xml 部件(发票示例中的 part3.xml)。(完毕)
3) 添加带有 xml xpaths 参考的自定义 xml 部件(发票示例中的 part4.xml)。(完毕)
4)添加内容控件(PENDING)
它必须类似于发票示例中的以下摘录:
这是我的问题:如何生成这个 xml ?可以通过 Java 代码完成还是只能从 Word 完成?“1418037941”和“DefaultPlaceholder_22675703”值是什么以及如何生成的?我想我不能“发明”它们,并在其他地方被引用。我正在 MainDocumentPart 类中寻找一些方法来执行此操作,但找不到它。我误解了什么吗?
其他步骤对我来说几乎没问题:
5)执行“预处理”(完成)
6)执行“过程”(完成)
7)执行“strip”(完成,除了删除repat标签)
非常感谢您的帮助!大卫