有没有办法使用 Python 有效地获取 word 文档(.doc、.docx)的页数?
对于 .odt 文件?
我想将它用于 Linux 上基于 Web2py 的 Web 应用程序。
谢谢 !
仅适用于搜索此博客条目的人....
from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)
#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
您可以读取值
<Properties>
<Pages>CountValue</Pages>
来自 docx 包中的 docProps/app.xml 或
<office:document-meta>
<office:meta>
<meta:document-statistic meta:page-count="CountValue">
在 odt 包中形成 meta.xml。
如果这些值不存在(它们是可选的),则必须对整个文档进行计算,实际上是进行渲染,这要困难得多