1

我想从扩展名为 docx 的 word 文档中提取数据。本文档包含一个表格。我想从表格的每一列和每一行中获取数据。

然后我想处理数据并将其插入到各自字段下的 Excel 文件中。

谁能指导我如何在python中做到这一点。

我在 windows 7 上使用 python3。(可能还想在 windows sever 2003 上运行此代码)。

任何帮助都感激不尽。

谢谢

4

1 回答 1

3

尝试类似:

import win32com.client as w32c

Word = w32c.Dispatch("Word.Application")
Word.Visible=1
doc=Word.Documents.Open("C:\\docx_with_a_table.docx")
tables=doc.Tables
for t_cnt in range(tables.Count):
    table=tables[t_cnt]
    for r_cnt in range(table.Rows.Count):
        row=table.Rows[r_cnt]
        for c_cnt in range(row.Cells.Count):
            cell=row.Cells[c_cnt]
            print(cell.Range.Text)

Word 文档上的 ALT+F11 和 F2 将显示 VBA 对象...在 Perl 中,上述过程有更好的文档记录。

Python3 的 xlrd3 和 xlwt3 包很好地支持读写 Excel

于 2012-05-02T06:39:17.070 回答