我有一个只有文本的 docx 文件。我想创建一个新的 docx 文件,其中仅包含原始 docx 中页面的一部分。我为此使用 python-docx。到目前为止,我已经能够遍历原始 docx 文档并将原始文档中的每个所需段落/运行复制到新文档中,如下所示(我相信这个例子应该制作一个精确的副本):
Doc = docx.Document('/tmp/input.docx')
OutDoc = docx.Document()
for para in Doc.paragraphs:
currentParagraph = OutDoc.add_paragraph(style=para.style)
for run in para.runs:
currentParagraph.add_run(run.text, style=run.style)
OutDoc.save('/tmp/output.docx')
尽管我正在复制所有样式信息,但我似乎遗漏了一些东西,因为输出缺少一些格式。