c# - 使用 Linq 读取 XML 文件

Question

概括：

我知道这是一个很长的阅读。总而言之，我需要不在documentation列中的每种语言下的名称、前缀和所有值。而且我还需要存储每个标签所归属的语言。

我的问题是：

读取数据并将其保存在正确的列中 - 主要是如果有一个空白值，它会抛出所有内容。在上面的 Excel 示例中，对于空白的日文标签，以下代码实际上将gl-plt移入该label列：

for(int t=0; t<labelLinkValues.Count; t+=labelLinkCol.Count) {

    for(int j=0; j<labelLinkCol.Count; j++) {
        if(labelLinkCol[j].Value=="prefix")
            Response.Write(labelLinkValues[t+j].Value+"<br/>");

        if(labelLinkCol[j].Value=="name")
            Response.Write(labelLinkValues[t+j].Value+"<br/>");

        for(int p=0; p<langList.Count; p++) {
            if(j>=langList[p].start&&j<=langList[p].end)
                if(labelLinkCol[j].Value!="documentation"&&labelLinkValues[j].Value!="")
                    Response.Write(langList[p].languageValue+"---"+labelLinkValues[t+j].Value+"<br/>");
        }

    }

    Response.Write("----<br>");
}

整个故事：

我正在尝试使用 Linq读取excel 导出的 XML 文件。我能够获取数据，但无法使其正常工作，无法将列与正确的行单元格对齐。

在我发布代码之前，我应该提到一些事情。该程序旨在读取任意数量的文件，它们可能有多种语言（第二行）。在这个特定的示例中，有两种语言，但将来可能有 1 种语言，3 种语言，例如，语言定义如下：

<Row ss:AutoFitHeight="0">
    <Cell ss:StyleID="ColumnHead2" ss:Index="4" ss:MergeAcross="1">
        <ss:Data ss:Type="String">en</ss:Data>
    </Cell>

    <Cell ss:StyleID="ColumnHead2" ss:MergeAcross="1">
        <ss:Data ss:Type="String">ja</ss:Data>
    </Cell>
</Row>

第一种语言的索引属性告诉你它从哪里开始，合并告诉你它跨越了多少列。后续语言仅包含跨值合并，这些值告诉您每种语言之后跨越多少列。

首先，这里是两行样本数据的截图。

（下载图像的分辨率更高）

这是第一行的相应 XML 代码：

<Row ss:AutoFitHeight="0">
    <Cell ss:StyleID="NoBorderNumberCell">
        <ss:Data ss:Type="Number">1</ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">gl-cor</ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">account</ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">Tuple: parent container for account numbers and identifiers. No entry is made here, but each detail line may have multiple accounts assigned to it for reporting in different GAAPs, offsetting accounts in Japan</ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">Account Identifier</ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">タプル。勘定科目番号と識別子&lt;/ss:Data>
    </Cell>

    <Cell ss:StyleID="NoBorderCell"/>

    <Cell ss:StyleID="NoBorderCell">
        <ss:Data ss:Type="String">gl-plt</ss:Data>
    </Cell>
</Row>

我需要从给定的 XML 文件中提取 3 个值：

名称和前缀不是语言的一部分并且始终存在，因此获取它们不是问题。

语言列下未显示的任何值documentation。所以我需要忽略这些documentation列。

现在这是我拥有的代码，可以在上面阅读：

XElement xdocument=XElement.Load(fpath);
XNamespace ns="urn:schemas-microsoft-com:office:spreadsheet";
XNamespace docProperties="urn:schemas-microsoft-com:office:office";
XNamespace ss="urn:schemas-microsoft-com:office:spreadsheet";
XNamespace search="ss";

var labelLinkCol=(
    from worksheets in xdocument.Elements(ns+"Worksheet")
    where (string)worksheets.Attribute(ss+"Name")=="Label Link"
    from columnHead in worksheets.Descendants(ns+"Cell")
    where (string)columnHead.Attribute(ss+"StyleID")=="ColumnHead"
    select columnHead
    ).ToList();

var langValues=(
    from worksheets in xdocument.Elements(ns+"Worksheet")
    where (string)worksheets.Attribute(ss+"Name")=="Label Link"
    from columnHead in worksheets.Descendants(ns+"Cell")
    where (string)columnHead.Attribute(ss+"StyleID")=="ColumnHead2"
    select columnHead
    ).ToList();

var labelLinkValues=(
    from worksheets in xdocument.Elements(ns+"Worksheet")
    where (string)worksheets.Attribute(ss+"Name")=="Label Link"
    from columnHead in worksheets.Descendants(ns+"Cell")
    where
        (string)columnHead.Attribute(ss+"StyleID")!="ColumnHead"
        &&
        (string)columnHead.Attribute(ss+"StyleID")!="ColumnHead2"
        &&
        (string)columnHead.Attribute(ss+"StyleID")!="ColumnHead2BL"
    select columnHead
    ).ToList();

int index=0;
List<language> langList=new List<language>();

for(int j=0; j<langValues.Count; j++) {
    language languageXML=new language();

    //the first value has the index
    if(j==0) {
        index=Convert.ToInt32(langValues[j].Attribute(ss+"Index").Value);
        languageXML.index=index;
        languageXML.start=index;
        languageXML.end=index+Convert.ToInt32(langValues[j].Attribute(ss+"MergeAcross").Value);
        languageXML.languageValue=langValues[j].Value;
    }
    else {
        //get the value of when the first language begins
        languageXML.index=index;

        //to get the beginning, get the end of the previous location and add 1
        languageXML.start=langList[langList.Count-1].end+1;

        //to get the last column, add the merge to the beginning
        languageXML.end=languageXML.start+Convert.ToInt32(langValues[j].Attribute(ss+"MergeAcross").Value);
        languageXML.languageValue=langValues[j].Value;
    }

    langList.Add(languageXML);
    //Response.Write(languageXML.start + "--" + languageXML.end + "--" + languageXML.languageValue + "<br>");
}

language是一个简单的类，只包含第一种语言的列、当前语言的起始列和当前语言的结束列。

我相信上面的代码是合理的。它读取所有值并正确识别每种语言的开始和结束位置，问题如帖子前面所述。

score 0 · Accepted Answer

在我看来，你让它变得比它需要的更复杂。我最近参与了一个项目，该项目要求用户从 excel 中复制数据，这些数据通过剪贴板作为 XML 电子表格读取，然后通过解析器发送并转换为表格格式。

我发现 XML 电子表格参考非常宝贵：http: //msdn.microsoft.com/en-us/library/office/aa140066 (v=office.10).aspx

您应该注意的一件事，我认为是您的问题的原因是 ss:Index 不是从零开始的（第 1 列 = 索引 1）。

它真的应该像遍历行然后遍历它们的单元格并跟踪单元格的索引一样简单。您可能还想检查所需的单元格是否有子数据元素。

c# - 使用 Linq 读取 XML 文件

1 回答 1

Related

Reference