0

一位同事在尝试查询时遇到了一个非常不寻常的 XML 文件的问题,在尝试帮助他之后,我和其他人有点创意障碍....看看这个,它可能会感兴趣这里很多人......

结构:

<Root>
 <MainFoo>
     <Foo>
        <A bla="bla" />
        <B bla1="blablabla" />
        <C bla2="blabla" />
        <Bar N="Education" V="Some Text" />
        <Bar N="Other Node" V="Some other Text" />
        <Bar N="Yet Other Node" V="Some other other Text" />
        <Bar N="fourth Bar Node" V="Some other other otherText" />
        <Bar N="UserID" V="1" />
     </Foo>
     <Foo>
        <A bla="bla" />
        <B bla1="blablabla" />
        <C bla2="blabla" />
        <Bar N="Education" V="Specific Text" />
        <Bar N="Other Node" V="Some other Text" />
        <Bar N="Yet Other Node" V="Some other other Text" />
        <Bar N="fourth Bar Node" V="Some other other otherText" />
        <Bar N="UserID" V="2" />
     </Foo>
     <Foo>
        <A bla="bla" />
        <B bla1="blablabla" />
        <C bla2="blabla" /> <!--***No Bar node with N="Education" in this Foo Node, not a mistake! this might be part of the problem but this is the XML Structure and can't be changed***-->
        <Bar N="Other Node" V="Some other Text" />
        <Bar N="Yet Other Node" V="Some other other Text" />
        <Bar N="fourth Bar Node" V="Some other other otherText" />
        <Bar N="UserID" V="3" />
     </Foo>
     <Foo>
        <A bla="bla" />
        <B bla1="blablabla" />
        <C bla2="blabla" />
        <Bar N="Education" V="Specific Text" />
        <Bar N="Other Node" V="Some other Text" />
        <Bar N="Yet Other Node" V="Some other other Text" />
        <Bar N="fourth Bar Node" V="Some other other otherText" />
        <Bar N="UserID" V="4" />
     </Foo>
 </MainFoo>
 <OtherMainFoo></OtherMainFoo>
 <MoreMainFoo></MoreMainFoo>
</Root>

好的,现在解决手头的问题:我们正在尝试使用 LINQ to XML 将每个用户节点的每个用户 ID 值转换为每个Foo 元素的字符串 IF此 Foo 中有一个Bar 节点和此Bar 节点的 N 属性是“教育”并且仅当具有教育属性的此条形节点的 V 的值不包含我们在 LINQ 中指定的单词时

例如,如果我们希望具有教育的 Foo 节点的所有用户 ID 不包含单词“Some”,我们将得到 2,4 的结果,因为 Foo 1 的 Bar 节点具有 N 属性的教育值,但它在 V 属性中有 Some 字符串和 Foo 编号 3 在它的 N 属性中没有带有 Education 值的 Bar 节点(非常重要,因为我们认为这是我们一直得到空结果的原因之一我们曾经这样做过)。

这里的任何 LINQ to XML 专家都有一个想法,这对于 XML 来说是一个非常不寻常的场景,但那是我们必须处理的问题,而且我认为这个问题会让很多人感兴趣。

4

4 回答 4

2

tl; 博士:

var hasEducation = contacts.Elements("MainFoo").Elements("Foo")
 .Where(foo => foo.Elements("Bar")
                 .Any(bar => (bar.Attribute("N").Value == "Education") &&
                     (!bar.Attribute("V").Value.ToLower().Contains("some") )))

注意:我用 LinqPad (http://www.linqpad.net/) 对此进行了测试,使用它并喜欢它。LinqPad 非常适合这些问题。下面是一个 LinqPad 查询的完整源代码,用于测试和玩自己。

主要在哪里处理 foo 的元素。然后它会检查元素(特别是“Bar”元素及其属性)是否有您希望应用的规则。

这里的关键问题是这种查询的可维护性如何。你能像这样维护一个 linq 查询吗?尝试使用 LinqPad——我相信它会让您(或任何人)更轻松地修改和开发这些查询。


要获取用户 ID 列表(作为约翰的回答),您只需添加

.Element("User").Attribute("ID").Value; 

到上面的查询结束。

当然,这不包括 John 性感的错误检查。


XElement contacts = XElement.Parse (@"
<Root>
 <MainFoo>
     <Foo>
        <A bla='bla' />
        <B bla1='blablabla' />
        <C bla2='blabla' />
        <Bar N='Education' V='Some Text' />
        <Bar N='Other Node' V='Some other Text' />
        <Bar N='Yet Other Node' V='Some other other Text' />
        <Bar N='fourth Bar Node' V='Some other other otherText' />
        <User ID='1' />
     </Foo>
     <Foo>
        <A bla='bla' />
        <B bla1='blablabla' />
        <C bla2='blabla' />
        <Bar N='Education' V='Specific Text' />
        <Bar N='Other Node' V='Some other Text' />
        <Bar N='Yet Other Node' V='Some other other Text' />
        <Bar N='fourth Bar Node' V='Some other other otherText' />
        <User ID='2' />
     </Foo>
     <Foo>
        <A bla='bla' />
        <B bla1='blablabla' />
        <C bla2='blabla' /> <!--***No Bar node with N='Education' in this Foo Node, not a mistake! this might be part of the problem but this is the XML Structure and can't be changed***-->
        <Bar N='Other Node' V='Some other Text' />
        <Bar N='Yet Other Node' V='Some other other Text' />
        <Bar N='fourth Bar Node' V='Some other other otherText' />
        <User ID='3' />
     </Foo>
     <Foo>
        <A bla='bla' />
        <B bla1='blablabla' />
        <C bla2='blabla' />
        <Bar N='Education' V='Specific Text' />
        <Bar N='Other Node' V='Some other Text' />
        <Bar N='Yet Other Node' V='Some other other Text' />
        <Bar N='fourth Bar Node' V='Some other other otherText' />
        <User ID='4' />
     </Foo>
 </MainFoo>
 <OtherMainFoo></OtherMainFoo>
 <MoreMainFoo></MoreMainFoo>
</Root>");

var hasEducation = contacts.Elements("MainFoo").Elements("Foo")
      .Where(foo => foo.Elements("Bar")
               .Any(bar => (bar.Attribute("N").Value == "Education") &&
                           (!bar.Attribute("V").Value.ToLower().Contains("some") )))
      .Dump();
于 2012-12-28T21:13:48.753 回答
2

为了让您的选择保持开放,这里有一个使用 XPath 而不是 LINQ 的解决方案。这不包括根据约翰的回答进行的错误检查,但它的工作原理都是一样的。

public static IEnumerable<string> GetIDs(XDocument doc, string negation)
{
    //The following xpath string will select all Foo elements that contain a Bar child
    // that has a N attribute with the value "Education" and also has a V attribute
    // that does not contain the specified string.
    string xPathString = String.Format("//Foo[(Bar/@N = 'Education') and (not(contains(Bar/@V, '{0}')))]", negation);

    return doc.Root
              .XPathSelectElements(xPathString) //Select the proper Foo elements
              .Select(a => a.Element("User").Attribute("ID").Value); //Grab the User elements under the previous Foo elements and return their ID attribute value
}
于 2012-12-28T21:47:11.157 回答
2
string text = "Some";
var query = from foo in xdoc.Descendants("Foo")
            let user = foo.Element("User")
            where user != null &&
                  foo.Elements("Bar")
                     .Any(bar => (string)bar.Attribute("N") == "Education" &&
                                 !Regex.IsMatch((string)bar.Attribute("V"), text,
                                                RegexOptions.IgnoreCase))
            select (int)user.Attribute("ID");

// result: 2, 4

我使用正则表达式在 bar 的属性中搜索单词有两个原因 - 使搜索不区分大小写,以及处理Bar元素没有V属性的情况。您也可以更改模式以匹配单词(不是单词的一部分)。


如果所有Foo节点都有User元素,您可以删除用户的空检查。此外,如果Bar元素始终包含V属性,并且您不需要不区分大小写的搜索,则可以简化查询:

var query = from foo in xdoc.Descendants("Foo")                     
            where foo.Elements("Bar")
                        .Any(bar => (string)bar.Attribute("N") == "Education" &&
                                    !((string)bar.Attribute("V")).Contains(text))
            select (int)foo.Element("User").Attribute("ID");
于 2012-12-28T22:24:08.860 回答
1

以下似乎有效:

public static IEnumerable<int> QueryComplexXml()
{
    var doc = XDocument.Parse(XML);
    if (doc.Root == null)
    {
        throw new System.InvalidOperationException("No root");
    }

    var mainFoo = doc.Root.Element("MainFoo");
    if (mainFoo == null)
    {
        throw new System.InvalidOperationException("No MainFoo");
    }

    var userIDs = from foo in mainFoo.Elements("Foo")
                  where
                      foo.Elements("Bar")
                         .Any(
                             bar =>
                             bar.Attribute("N").Value == "Education" &&
                             bar.Attribute("V").Value == "Specific Text")
                  let user = foo.Element("User")
                  where user != null
                  select int.Parse(user.Attribute("ID").Value);
    return userIDs;
}

代码考虑了所有的“Foo”元素,但只考虑了那些“Bar”元素具有“Education”的“N”属性和“Specific Text”的“V”属性的那些(你可以放置任何谓词你想在那里)。对于每个选定的元素,它会提取“用户”元素(假设有一个,然后解析并返回“ID”属性。

在您发布的示例 XML 中,这将返回 2 和 4。

于 2012-12-28T20:54:41.367 回答