3

有没有办法使用 Python 有效地获取 word 文档(.doc、.docx)的页数?

对于 .odt 文件?

我想将它用于 Linux 上基于 Web2py 的 Web 应用程序。

谢谢 !

4

2 回答 2

6

仅适用于搜索此博客条目的人....

from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)

#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
于 2013-05-22T16:18:00.193 回答
3

您可以读取值

<Properties>
<Pages>CountValue</Pages>

来自 docx 包中的 docProps/app.xml 或

<office:document-meta>
    <office:meta>
        <meta:document-statistic meta:page-count="CountValue">

在 odt 包中形成 meta.xml。

如果这些值不存在(它们是可选的),则必须对整个文档进行计算,实际上是进行渲染,这要困难得多

于 2012-10-19T10:37:34.360 回答