我在 Word 中有一个表格,里面有不同的文本,还有一些使用 Microsoft Equation 3.0 的方程式。
我目前正在尝试从表格中读取文本并使用同一个表格创建一个 Excel 工作表。
是否有某种方法可以将 Word 中的方程式标准化为文本?
如果没有,有人知道我如何识别方程式来绕过它吗?
我当前读取表格的代码是这样的:
word = win32.gencache.EnsureDispatch('Word.Application')
word.Visible = False
raw_files = glob('*.docx')
xl = win32.gencache.EnsureDispatch('Excel.Application')
ss = xl.Workbooks.Add()
for f in raw_files:
word.Documents.Open(f)
doc = word.ActiveDocument
for x in xrange(1, doc.Paragraphs.Count+1):
oText = doc.Paragraphs(x)
if oText.Range.Tables.Count >0 :
ph = ss.ActiveSheet
for r in xrange(1, oText.Range.Tables(1).Rows.Count):
for c in xrange(1, oText.Range.Tables(1).Columns.Count):
if oText.Range.Tables(1).Cell(r,c).Range.Text != None:
ph.Cells(r+2,c).Value = oText.Range.Tables(1).Cell(r,c).Range.Text
当我遇到等式时的错误是“请求的成员不存在”。
有没有一种简单的方法可以绕过包含方程式的单元格?