0

我想解析我在这里拥有的 XML 文件并打印元素的id属性。internal

这是 XML 文件

<?xml version="1.0"?>
<!DOCTYPE test SYSTEM "http://www.kegg.jp/kegg/xml/KGML_v0.7.1_.dtd">
<test name="A" >
    <node id="11" name="test1" >
        <internal id="111" name="A111"/>
     </node>
    <node id="12" name="B">
        <internal id="121" name="B121"/>
        <internal id="122" name="B122"/>

     </node>
</test>

这是代码,当一个节点有两个内部属性时它会失败

use strict;
use warnings;

use XML::Simple;
use Data::Dumper;

my $xml=new XML::Simple; 
my $doc=$xml->XMLin("test.xml",KeyAttr => ['id']);

print Dumper($doc);

foreach my $node ( sort  keys %{$doc->{node}} ) {
    print $doc->{node}->{$node}->{internal}->{id}."\n";
} 

这是自卸车的样子

$VAR1 = {
      'name' => 'test1',
      'node' => {
                '11' => {
                        'name' => 'A',
                        'internal' => {
                                      'name' => 'A111',
                                      'id' => '111'
                                    }
                      },
                '12' => {
                        'name' => 'B',
                        'internal' => {
                                      '122' => {
                                               'name' => 'B122'
                                             },
                                      '121' => {
                                               'name' => 'B121'
                                             }
                                    }
                      }
              }
    };
4

2 回答 2

0

代码:

#!/usr/bin/perl -w
use strict;
use warnings;

use XML::Simple;
use Data::Dumper;

my $xml=new XML::Simple;
my $doc=$xml->XMLin(&get_str(),ForceArray => ['internal'],KeyAttr => 'id');
print Dumper($doc);
    
sub get_str {
  return qq#<?xml version="1.0"?>
<!DOCTYPE test SYSTEM "http://www.kegg.jp/kegg/xml/KGML_v0.7.1_.dtd">
<test name="A" >
    <node id="11" name="test1" >
        <internal id="111" name="A111"/>
     </node>
    <node id="12" name="B">
        <internal id="121" name="B121"/>
        <internal id="122" name="B122"/>

     </node>
</test>#;
}

输出:

$VAR1 = {
      'name' => 'A',
      'node' => {
                '11' => {
                        'name' => 'test1',
                        'internal' => {
                                      '111' => {
                                               'name' => 'A111'
                                             }
                                    }
                      },
                '12' => {
                        'name' => 'B',
                        'internal' => {
                                      '122' => {
                                               'name' => 'B122'
                                             },
                                      '121' => {
                                               'name' => 'B121'
                                             }
                                    }
                      }
              }
    };

原因

注 1:'KeyAttr' 的默认值为 ['name', 'key', 'id']。如果您不想在输入时折叠或在输出时展开,则必须将此选项设置为空列表以禁用该功能。

注意 2:如果您希望使用此选项,您还应该启用 ForceArray 选项。如果没有“ForceArray”,单个嵌套元素将被卷入一个标量而不是一个数组,因此不会被折叠(因为只有数组被折叠)。

于 2013-10-03T03:57:25.780 回答
0

添加

ForceArray => [qw( node internal )]

代码:

my $doc = XMLin(\$xml,
   ForceArray => [qw( node internal )],
   KeyAttr    => [qw( id )],
);

print(Dumper($doc));

my $nodes = $doc->{node};
for my $node_key ( sort { $a <=> $b } keys %$nodes ) {
   my $node = $nodes->{$node_key};
   my $internals = $node->{internal};

   for my $internal_key ( sort { $a <=> $b } keys %$internals ) {
      print("$internal_key\n");

      # my $internal = $internals->{$internal_key};
      # print("$internal->{name}\n");
   }
}
于 2013-10-01T14:23:30.383 回答