我正在解析一个简单的 XML 文件以从中创建一个平面文本文件。期望的结果显示在示例 XML 下方。XML 具有某种标题-详细结构(分别为 Assembly_Info 和 Part),具有唯一的标题节点,后跟任意数量的详细记录节点,所有这些节点都是兄弟节点。在深入研究标题下的元素后,我找不到返回“向上”的方法,然后拾取所有同级详细节点。
XML 文件如下所示:
<?xml version="1.0" standalone="yes" ?>
<Wrapper>
<Record>
<Product>
<prodid>4094</prodid>
</Product>
<Assembly>
<Assembly_Info>
<id>DF-7A</id>
<interface>C</interface>
</Assembly_Info>
<Part>
<status>N/A</status>
<dev_name>0000</dev_name>
</Part>
<Part>
<status>Ready</status>
<dev_name>0455</dev_name>
</Part>
<Part>
<status>Ready</status>
<dev_name>045A</dev_name>
</Part>
</Assembly>
<Assembly>
<Assembly_Info>
<id>DF-7A</id>
<interface>C</interface>
</Assembly_Info>
<Part>
<status>N/A</status>
<dev_name>0002</dev_name>
</Part>
<Part>
<status>Ready</status>
<dev_name>0457</dev_name>
</Part>
</Assembly>
</Record>
</Wrapper>
对于每个程序集,我需要读取我成功完成的 Assembly_Info 中两个元素的值。但是,然后我想阅读与程序集关联的每个零件记录。目标是将文件“扁平化”为:
prodid id interface status dev_name
4094 DF-7A C N/A 0000
4094 DF-7A C Ready 0455
4094 DF-7A C Ready 045A
4094 DF-7A C N/A 0002
4094 DF-7A C Ready 0457
我正在尝试使用 findnodes() 来执行此操作,因为这是我认为我理解的唯一工具。不幸的是,我的代码从整个文件中读取了所有部件记录 foreach 程序集——因为我能够找到部件节点的唯一方法是从根目录开始。如果你愿意,我不知道如何改变“我在哪里”;告诉 findnodes 从当前父节点开始。代码如下所示:
my $parser = XML::LibXML -> new();
my $tree = $parser -> parse_file ('DEMO.XML');
for my $product ($tree->findnodes ('/Wrapper/Record/Product/prodid')) {
$prodid = $product->textContent();
}
foreach my $assembly ($tree->findnodes ('/Wrapper/Record/Assembly')){
$assemblies++;
$parts = 0;
for my $assembly ($tree->findnodes ('/Wrapper/Record/Assembly/Assembly_Info')) {
$id = $assembly->findvalue('id');
$interface = $assembly->findvalue('interface');
}
foreach my $part ($tree->findnodes ('/Wrapper/Record/Assembly/Part')) {
$parts++;
$status = $part->findvalue('status');
$dev_name = $part->findvalue('dev_name');
}
print "Assembly No: ", $assemblies, " Parts: ",$parts, "\n";
}
在我深入到 Assembly_Info 深度之后,如何仅获取给定装配的零件节点?有很多我没有得到,我认为一个问题可能是我认为这是“导航”或移动光标,如果你愿意的话。XPath 路径表达式的示例对我没有帮助。