重写为看起来更像一个编程问题
好的,所以我做了更多的研究,看起来我需要使用的 java 包是 docx4j。不幸的是,我对包以及 PDF 格式的基础不熟悉,这让我很难弄清楚如何使用返回的页眉和页脚SectionWrapper.getHeaderFooterPolicy()
。HeaderPart
返回的和FooterPart
对象是否可写或如何修改它们并不完全清楚。
有这个代码提供了一个如何创建标题部分的示例,但它会创建一个新的HeaderPart
并将其添加到文档中。
我想找到现有的页眉/页脚部分,如果可能的话,要么删除它们,要么清空它们。理想情况下,它们会完全从文档中消失。
这段代码是相似的,允许您使用设置标题部分的文本,setJaxbElement
但是这个术语有很多是不熟悉的,我担心最终结果将是我在每个文档中创建标题(尽管是空的)而不是删除它们。
下面的原始问题
我正在处理一组变化很大的 MS Word 文档。我正在将它们编译成一个 PDF,并希望在这样做之前确保它们都没有页眉或页脚。
理想情况下,如果它不是 Times New Roman,我还想覆盖他们的默认字体。
有没有办法以编程方式或使用某种批处理来执行此操作?
我将在当前没有安装 Office 或 Word 的 Windows 服务器上运行它(尽管我认为它可能安装了 OpenOffice,当然添加安装也很容易)。
现在我正在使用某些版本的 iText (java) 将文件转换为 PDF。我知道显然 iText 不能做诸如删除页眉/页脚之类的事情,但是由于现代 .doc 文件的底层结构是 XML,我想知道是否有 API(甚至是 XML 解析/编辑 API,或者,如果所有其他方法都失败了,一个 RegEx [horrors]) 用于删除页眉和页脚并设置一些默认样式。