0

我正在解析一个简单的 XML 文件以从中创建一个平面文本文件。期望的结果显示在示例 XML 下方。XML 具有某种标题-详细结构(分别为 Assembly_Info 和 Part),具有唯一的标题节点,后跟任意数量的详细记录节点,所有这些节点都是兄弟节点。在深入研究标题下的元素后,我找不到返回“向上”的方法,然后拾取所有同级详细节点。

XML 文件如下所示:

<?xml version="1.0" standalone="yes" ?>
<Wrapper>
  <Record>
    <Product>
      <prodid>4094</prodid>
    </Product>
    <Assembly>
      <Assembly_Info>
        <id>DF-7A</id>
        <interface>C</interface>
      </Assembly_Info>
      <Part>
        <status>N/A</status>
        <dev_name>0000</dev_name>
      </Part>
      <Part>
        <status>Ready</status>
        <dev_name>0455</dev_name>
      </Part>
      <Part>
        <status>Ready</status>
        <dev_name>045A</dev_name>
      </Part>
    </Assembly>
    <Assembly>
      <Assembly_Info>
        <id>DF-7A</id>
        <interface>C</interface>
      </Assembly_Info>
      <Part>
        <status>N/A</status>
        <dev_name>0002</dev_name>
      </Part>
      <Part>
        <status>Ready</status>
        <dev_name>0457</dev_name>
      </Part>
     </Assembly>
  </Record>
</Wrapper>

对于每个程序集,我需要读取我成功完成的 Assembly_Info 中两个元素的值。但是,然后我想阅读与程序集关联的每个零件记录。目标是将文件“扁平化”为:

  prodid    id      interface   status      dev_name
    4094    DF-7A   C           N/A         0000
    4094    DF-7A   C           Ready       0455
    4094    DF-7A   C           Ready       045A
    4094    DF-7A   C           N/A         0002
    4094    DF-7A   C           Ready       0457

我正在尝试使用 findnodes() 来执行此操作,因为这是我认为我理解的唯一工具。不幸的是,我的代码从整个文件中读取了所有部件记录 foreach 程序集——因为我能够找到部件节点的唯一方法是从根目录开始。如果你愿意,我不知道如何改变“我在哪里”;告诉 findnodes 从当前父节点开始。代码如下所示:

my $parser = XML::LibXML -> new();
my $tree = $parser -> parse_file ('DEMO.XML');

    for my $product ($tree->findnodes ('/Wrapper/Record/Product/prodid')) {
        $prodid = $product->textContent();
    }

    foreach my $assembly ($tree->findnodes ('/Wrapper/Record/Assembly')){
        $assemblies++;
        $parts = 0;
        for my $assembly ($tree->findnodes ('/Wrapper/Record/Assembly/Assembly_Info')) {
            $id = $assembly->findvalue('id');
            $interface = $assembly->findvalue('interface');
        }

        foreach my $part ($tree->findnodes ('/Wrapper/Record/Assembly/Part')) {
            $parts++;
            $status          = $part->findvalue('status');
            $dev_name        = $part->findvalue('dev_name');
        }
        print "Assembly No: ", $assemblies, " Parts: ",$parts, "\n";
    }

在我深入到 Assembly_Info 深度之后,如何仅获取给定装配的零件节点?有很多我没有得到,我认为一个问题可能是我认为这是“导航”或移动光标,如果你愿意的话。XPath 路径表达式的示例对我没有帮助。

4

1 回答 1

1

您可以使用任何其他节点,尤其是子节点,而不是始终$tree用作该方法的起点。findnodes然后您可以使用相对 XPath 表达式。例如:

for my $record ($tree->findnodes('/Wrapper/Record')) {
    for my $assembly ($record->findnodes('./Assembly')) {
        for my $part ($assembly->findnodes('./Part')) {
        }
    }
}
于 2013-08-15T06:20:38.057 回答