5

我有以下 xml 文件

<?xml version="1.0"?>
<!DOCTYPE pathway SYSTEM "http://www.kegg.jp/kegg/xml/KGML_v0.7.1_.dtd">
<pathway name="path:ko01200" org="ko" >
    <entry id="1" >
        <graphics name="one" 
             type="circle" />
    </entry>
    <entry id="7" >
        <graphics name="one" 
             type="rectangle" />
        <graphics name="two" 
             type="rectangle"/>
    </entry>
</pathway>

我厌倦了使用 xml simple 和下面的代码来解析它,因为其中一个节点有 2 个图形元素,所以我被卡住了。所以它抱怨。我假设我必须有另一个用于图形元素的 foreach 循环,但我不知道如何进行。

use strict;
use warnings;
use XML::Simple;
use Data::Dumper;

my $xml=new XML::Simple;
my $data=$xml->XMLin("file.xml",KeyAttr => ['id']);
print Dumper($data);    
foreach my $entry (   keys %{$data->{entry}} ) {
    print $data->{entry}->{$entry}->{graphics}->{type}."\n";            
}

这是代码结果

$VAR1 = {
      'entry' => {
                 '1' => {
                        'graphics' => {
                                      'name' => 'one...',
                                      'type' => 'circle'
                                    }
                      },
                 '7' => {
                        'graphics' => [
                                      {
                                        'name' => 'one',
                                        'type' => 'rectangle'
                                      },
                                      {
                                        'name' => 'two',
                                        'type' => 'rectangle'
                                      }
                                    ]
                      }
               },
      'org' => 'ko',
      'name' => 'path:ko01200'
    };
circle
Not a HASH reference at stack.pl line 12.
4

1 回答 1

7

XML::Simple缺乏一致性,因为它取决于用户启用严格模式,所以graphics节点有时是散列,有时是数组,具体取决于子元素的数量。

for my $entry ( keys %{$data->{entry}} ) {

    my $graphics = $data->{entry}{$entry}{graphics};
    $graphics = [ $graphics ] if ref $graphics eq "HASH";
    print "$_->{type}\n" for @$graphics;
}

有更好的 XML 解析模块,请查看XML::LibXML

或作为@RobEarl 建议的使用ForceArray参数:

 XMLin("file.xml",KeyAttr => ['id'], ForceArray => [ 'graphics' ]);
于 2013-09-30T08:27:16.743 回答