我有一个应用程序可以将文档导出为 XML 文件。导出的文档是OpenXml
格式的,可以使用 Word 识别/编辑(见下面的注 1)。该文档包含一个相当复杂的表结构,其中“顶部”表有几个单元格,每个单元格都包含一个子表。我的任务是编写一个为用户提供按钮的 VSTO 加载项。当用户打开这些 XML 文件之一并单击按钮时,插件会在“顶部”表和子表中定位和操作文本。
我的原始代码(参见下面的“代码”)使用 Microsoft.Office.Interop.Word.Table 类来定位“顶部”表和子表中的每个单元格。
当我的代码开始抛出异常时,事情变得很奇怪,因为在其中一张表上,Column.Count 属性显示为 3,但使用 throw 访问单元objTable.Cell(row, column)
格The requested member of the collection does not exist
。使用调试器,即使 Count 属性显示 3,我也可以看到第 3 列不存在(注意:我观察到 Column 索引是从 1 开始的,而不是从零开始的)。
我是否需要在加载项中即时将 Word 文档转换为 OpenXml 文档并使用 OpenXml Table 类成功访问表?
认为这是答案,我安装Open XML Package Editor for Modern Visual Studios
并添加了DocumentFormat.OpenXml
和的引用Windows.Base
。但是,当我进行演员表时:
WordprocessingDocument doc = (WordprocessingDocument)Globals.ThisAddIn.Application.ActiveDocument;
它抛出这个异常:
System.InvalidCastException。无法将类型为“Microsoft.Office.Interop.Word.DocumentClass”的 COM 对象转换为类类型“DocumentFormat.OpenXml.Packaging.WordprocessingDocument”。表示 COM 组件的类型的实例不能转换为不表示 COM 组件的类型;但是,只要底层 COM 组件支持对接口的 IID 的 QueryInterface 调用,它们就可以转换为接口。
我可以/如何在我的 VSTO 加载项中将 Globals.ThisAddIn.Application.ActiveDocument 转换为 OpenXml WordprocessingDocument 吗?
代码
Microsoft.Office.Interop.Word.Range rngDoc = Globals.ThisAddIn.Application.ActiveDocument.Content;
int i = 1;
foreach (Microsoft.Office.Interop.Word.Table objTable in rngDoc.Tables)
{
DumpTable(objTable: objTable, tableNumber: i++, childTableNumber: 0);
}
private void DumpTable(Microsoft.Office.Interop.Word.Table objTable, int tableNumber, int childTableNumber)
{
for (int row = 1; row <= objTable.Rows.Count; row++)
{
for (int column = 1; column <= objTable.Columns.Count; column++)
{
Cell cell = null;
try
{
cell = objTable.Cell(row, column);
Debug.WriteLine(string.Format("Table {0}.{1}. row={2}. column={3}. cell text={4}", tableNumber, childTableNumber, row, column, cell.Range.Text));
}
catch (Exception e)
{
Debug.WriteLine(string.Format("Table {0}.{1}. row={2} + column={3} threw exception: {4}", tableNumber, childTableNumber, row, column, e.Message));
}
}
}
Debug.WriteLine(string.Format("Table {0}.{1}. Start Child Tables", tableNumber, childTableNumber));
foreach (Microsoft.Office.Interop.Word.Table child_tb in objTable.Tables)
{
DumpTable(child_tb, tableNumber, childTableNumber + 1);
}
Debug.WriteLine(string.Format("Table {0}.{1}. End Child Tables", tableNumber, childTableNumber++));
}
注1
我假设该文档是 OpenXml 格式,基于对文件前导的检查(请参阅 参考资料xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
)
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<?mso-application progid="Word.Document"?>
<w:wordDocument xmlns:aml="http://schemas.microsoft.com/aml/2001/core"
xmlns:wpc="http://schemas.microsoft.com/office/word/2010/wordprocessingCanvas"
xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882"
xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:v="urn:schemas-microsoft-com:vml"
xmlns:w10="urn:schemas-microsoft-com:office:word"
xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml"
xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint"
xmlns:wne="http://schemas.microsoft.com/office/word/2006/wordml"
xmlns:wsp="http://schemas.microsoft.com/office/word/2003/wordml/sp2"
xmlns:sl="http://schemas.microsoft.com/schemaLibrary/2003/core"
xmlns:ns0="http://tempuri.org/AllInOneOctoFBISchema.xsd"
xmlns:ns1="http://tempuri.org/AllInOneOctoFBIFirstFooterSchema.xsd"
w:macrosPresent="no" w:embeddedObjPresent="no"
w:ocxPresent="no" xml:space="preserve"><w:ignoreSubtree
w:val="http://schemas.microsoft.com/office/word/2003/wordml/sp2"/>
.
.
remainder of file