3

我正在使用 OpenXML 打开电子表格并循环遍历电子表格的行。我有一个 linq 查询,它返回一行中的所有单元格。linq 查询直接来自 MSDN 上的演示。

IEnumerable<String> textValues =
    from cell in row.Descendants<Cell>()
    where cell.CellValue != null
    select (cell.DataType != null
            && cell.DataType.HasValue
            && cell.DataType == CellValues.SharedString
            ? sharedString.ChildElements[int.Parse(cell.CellValue.InnerText)].InnerText
            : cell.CellValue.InnerText);

linq 查询非常擅长返回所有具有值的单元格,但它不会返回没有值的单元格。这反过来又使得无法分辨哪个单元格是哪个单元格。让我再解释一下。例如,我们的电子表格中有三列:姓名、SSN 和地址。这个 linq 查询的工作方式是它只返回那些对给定行具有值的单元格。因此,如果有一行数据包含“John”、“”、“173 Sycamore”,那么 linq 查询只会在枚举中返回“John”和“173 Sycamore”,这反过来又让我无法知道是否“173 Sycamore”是 SSN 或地址字段。

让我在这里重申一下:我需要的是返回所有单元格,而不仅仅是包含 value 的单元格

我试图以我能想到的各种方式来监视 linq 查询,但我没有任何运气(即 - 删除 where 子句不是诀窍)。任何帮助,将不胜感激。谢谢!

4

3 回答 3

4

OpenXML 标准没有为没有数据的单元格定义占位符。换句话说,它在 XML 中的底层存储是稀疏的。您可以通过以下两种方式之一解决此问题:

  1. 创建所有“可用”或“可能”单元格的列表(可能通过使用 CROSS JOIN类型的操作)然后“左”连接到row.Descendants<Cell>()集合以查看单元格引用是否具有值
  2. 使用诸如ClosedXMLEPPlus 之类的第 3 方工具作为Excel 数据的包装器并查询它们的接口,这对开发人员更加友好。
于 2012-01-19T00:05:22.683 回答
3

使用 ClosedXML:

var wb = new XLWorkbook("YourWorkbook.xlsx");
var ws = wb.Worksheet("YourWorksheetName");
var range = ws.RangeUsed();
foreach(var row in range.Rows())
{
   // Do something with the row...
   // ...

   foreach(var cell in row.Cells())
   {
      // Now do something with every cell in the row
      // ...
   }
}
于 2012-01-19T15:03:38.610 回答
0

我推荐的一种方法是用空白数据填充所有空单元格,以便您的 linq 语句返回它们。请参阅此答案以了解如何执行此操作。

于 2012-01-19T18:34:44.590 回答