我想从扩展名为 docx 的 word 文档中提取数据。本文档包含一个表格。我想从表格的每一列和每一行中获取数据。
然后我想处理数据并将其插入到各自字段下的 Excel 文件中。
谁能指导我如何在python中做到这一点。
我在 windows 7 上使用 python3。(可能还想在 windows sever 2003 上运行此代码)。
任何帮助都感激不尽。
谢谢
我想从扩展名为 docx 的 word 文档中提取数据。本文档包含一个表格。我想从表格的每一列和每一行中获取数据。
然后我想处理数据并将其插入到各自字段下的 Excel 文件中。
谁能指导我如何在python中做到这一点。
我在 windows 7 上使用 python3。(可能还想在 windows sever 2003 上运行此代码)。
任何帮助都感激不尽。
谢谢
尝试类似:
import win32com.client as w32c
Word = w32c.Dispatch("Word.Application")
Word.Visible=1
doc=Word.Documents.Open("C:\\docx_with_a_table.docx")
tables=doc.Tables
for t_cnt in range(tables.Count):
table=tables[t_cnt]
for r_cnt in range(table.Rows.Count):
row=table.Rows[r_cnt]
for c_cnt in range(row.Cells.Count):
cell=row.Cells[c_cnt]
print(cell.Range.Text)
Word 文档上的 ALT+F11 和 F2 将显示 VBA 对象...在 Perl 中,上述过程有更好的文档记录。
Python3 的 xlrd3 和 xlwt3 包很好地支持读写 Excel