2

我正在尝试解析具有以下内容的 XML 文件:

<?xml version="1.0" encoding="UTF-8"?>
<sentences>
<lastmodified>none</lastmodified>
<sentencedefs xml:lang="common">
</sentencedefs>
<sentencedefs xml:lang="en-US">
<baselanguage xml:lang="en-US"/>
</sentencedefs>
</sentences>

我用来解析它的 perl 代码如下所示(实际上这是代码关键部分的精简版):

use 5.006_001;
use strict;
use warnings;
use English '-no_match_vars';
use XML::LibXML;

my $SENTENCEDEFS       = "sentencedefs";
my $LANG               = "lang";

my $lParser = XML::LibXML->new;
my $lSentencesDoc  = $lParser->parse_file("sentences.xml");
my $lSentencesRoot = $lSentencesDoc->documentElement();
my @lSentenceDefs = $lSentencesRoot->getElementsByTagName($SENTENCEDEFS);

foreach my $lDefs (@lSentenceDefs)
{
  my @lAttrs = $lDefs->attributes();
  foreach my $lAttr (@lAttrs)
  {
    print("Attr: " . $lAttr->toString(1) . "\n");
  }

  my $lLang = $lDefs->getAttribute($LANG);
  my $lFound = defined($lLang);
  print("Found $LANG? $lFound \n");
}

我以前一直在使用 LibXML V1.58。我现在正在针对 LibXML V1.70 进行测试,发现输出不同:

V1.58:

Attr:  xml:lang="common"
Found lang? 1
Attr:  xml:lang="en-US"
Found lang? 1

V1.70:

Attr:  xml:lang="common"
Found lang?
Attr:  xml:lang="en-US"
Found lang?

V1.70 仅在我使用 $LANG="xml:lang" 时才找到该属性。

谁能解释为什么 LibXML V1.70 处理我的 XML 的方式不同?我可以对我的代码进行更改以使其在同时运行 V1.58 和 V1.70 时表现相同吗?我无法更改 XML 文档。

4

1 回答 1

3

我怀疑它与底层 libxml2 库的版本有关,但行为发生了变化,因为它曾经给出错误的答案。(该元素没有lang在 null 命名空间中命名的属性。)

正确的调用(定义在这里)是

$element->getAttributeNS('http://www.w3.org/XML/1998/namespace', 'lang')

我没有办法测试这是否适用于您的两种环境。如果没有,您总是可以使代码有条件

$XML::LibXML::VERSION         # Version of XML::LibXML (e.g. 1.70)

或者

XML::LibXML::LIBXML_VERSION   # Version of libxml2 (e.g. 20707 for 2.7.7)
于 2012-09-07T15:16:06.130 回答