2

我想以类似 SAX 的方式使用 OpenXML SDK v2.0 读取 Excel 2007+ 文档。我使用这篇博文作为粗略指南:http: //blogs.msdn.com/b/brian_jones/archive/2010/05/27/parsing-and-reading-large-excel-files-with-the-open -xml-sdk.aspx

但是,在我的文档中,我混合了字符串和数值。因此,字符串值被存储为 SharedString,因此当为这样的单元格读取 CellValue 时,我得到一个数字,我读到的是索引(因此需要获取 InnerText)。这似乎增加了太多的复杂性。无论如何,我是否可以简单地将工作表中的所有单元格视为文本/字符串,并以类似于博客文章示例的方式遍历所有获取值的单元格?

谢谢

4

1 回答 1

10

以下内容会有帮助吗?

List<string> listShared = new List<string>();
using (SpreadsheetDocument xl = SpreadsheetDocument.Open("YourFile.xlsx", false))
{
    SharedStringItem ssi;
    using (OpenXmlReader oxrShared = OpenXmlReader.Create(xl.WorkbookPart.SharedStringTablePart))
    {
        while (oxrShared.Read())
        {
            if (oxrShared.ElementType == typeof(SharedStringItem))
            {
                ssi = (SharedStringItem)oxrShared.LoadCurrentElement();
                // this assumes the shared string is a simple text format, instead of rich text.
                listShared.Add(ssi.Text.Text);
            }
        }
    }

    WorksheetPart wsp = xl.WorkbookPart.WorksheetParts.First();
    Cell c;
    using (OpenXmlReader oxrCells = OpenXmlReader.Create(wsp))
    {
        while (oxrCells.Read())
        {
            if (oxrCells.ElementType == typeof(Cell))
            {
                c = (Cell)oxrCells.LoadCurrentElement();
                // c.CellReference holds a string such as "A1"
                if (c.DataType != null)
                {
                    if (c.DataType == CellValues.SharedString)
                    {
                        // use whichever from-string-to-number conversion
                        // you like.
                        //listShared[Convert.ToInt32(c.CellValue.Text)];
                    }
                    else if (c.DataType == CellValues.Number)
                    {
                        // "normal" value
                        //c.CellValue.Text;
                    }
                    // there's also boolean, which you might be interested
                    // as well as other types
                }
                else
                {
                    // is by default a Number. Use this:
                    //c.CellValue.Text;
                }
            }
        }
    }
}

注意:没有错误绑定检查或无效检查。它旨在说明如何以最简单的最小方式获取共享字符串。

此外,共享字符串列表被假定为“简单”共享字符串,这意味着没有富文本。

逻辑是您将工作表中的共享字符串列表加载到您可以轻松操作的列表中。然后,当您遍历单元格时,如果您看到数据类型为 SharedString 的单元格,则可以再次检查列表。如果单元格的数据类型为数字,则照常进行。

于 2013-02-20T13:28:33.203 回答