我正在尝试解析具有以下内容的 XML 文件:
<?xml version="1.0" encoding="UTF-8"?>
<sentences>
<lastmodified>none</lastmodified>
<sentencedefs xml:lang="common">
</sentencedefs>
<sentencedefs xml:lang="en-US">
<baselanguage xml:lang="en-US"/>
</sentencedefs>
</sentences>
我用来解析它的 perl 代码如下所示(实际上这是代码关键部分的精简版):
use 5.006_001;
use strict;
use warnings;
use English '-no_match_vars';
use XML::LibXML;
my $SENTENCEDEFS = "sentencedefs";
my $LANG = "lang";
my $lParser = XML::LibXML->new;
my $lSentencesDoc = $lParser->parse_file("sentences.xml");
my $lSentencesRoot = $lSentencesDoc->documentElement();
my @lSentenceDefs = $lSentencesRoot->getElementsByTagName($SENTENCEDEFS);
foreach my $lDefs (@lSentenceDefs)
{
my @lAttrs = $lDefs->attributes();
foreach my $lAttr (@lAttrs)
{
print("Attr: " . $lAttr->toString(1) . "\n");
}
my $lLang = $lDefs->getAttribute($LANG);
my $lFound = defined($lLang);
print("Found $LANG? $lFound \n");
}
我以前一直在使用 LibXML V1.58。我现在正在针对 LibXML V1.70 进行测试,发现输出不同:
V1.58:
Attr: xml:lang="common"
Found lang? 1
Attr: xml:lang="en-US"
Found lang? 1
V1.70:
Attr: xml:lang="common"
Found lang?
Attr: xml:lang="en-US"
Found lang?
V1.70 仅在我使用 $LANG="xml:lang" 时才找到该属性。
谁能解释为什么 LibXML V1.70 处理我的 XML 的方式不同?我可以对我的代码进行更改以使其在同时运行 V1.58 和 V1.70 时表现相同吗?我无法更改 XML 文档。