2

我正在用 C# .Net 编写一个 XML 解析器,对于这个特定的 XML 块,我很难概念化如何解析并将它的关系存储在数据库中。请参阅下面的示例 xml:

<Article name="x" date="y">
    <Words>
        <Category ID="1000" Name="Person">
            <Keyword ID="1124" Name="Adult">
                <Keyword ID="1125" Name="Female" />
            </Keyword>
        </Category>
        <Category ID="1000" Name="Person">
            <Keyword ID="1124" Name="Adult">
                  <Keyword ID="1126" Name="Male" />
            </Keyword>
        </Category>
    </Words>
</Article>

所以你可以看到有N 个类别,每个类别都包含N 个嵌套的关键字节点。表示这种关系数据的最佳方式是什么?

我有一个包含所有可能的关键字和类别组合的主 XML 文档。这是我的第一个想法,但如果有更好的方法,请纠正我:

  1. 所有关键字/类别的表:ID、名称、ParentID
  2. 文章表:ID、姓名、日期、
  3. 转到每个类别节点中最底部的关键字节点并添加到查找表:ID、ArticleID、KeywordID

然后我可以做一个连接并递归地找到最底部关键字节点的所有父节点。

4

1 回答 1

2

如果您只想获取最底部的关键字,那么您可以在选择之前检查关键字元素是否包含任何子节点:

var xdoc = XDocument.Load(path_to_xml);
var keywords = from k in xdoc.Descendants("Keyword")
               where !k.Elements().Any()
               select new
               {
                   ID = (int)k.Attribute("ID"),
                   Name = (string)k.Attribute("Name")
               };

输出:

{ ID = 1125, Name = Female }
{ ID = 1126, Name = Male }

更新:获取叶关键字元素的 XPath 解决方案

var keywords = xdoc.XPathSelectElements("//Keyword[not(*)]");
于 2013-09-17T16:08:08.947 回答