4

我选择性地修复了一些元素和属性。不幸的是,我们的输入文件包含单引号和双引号的属性值。此外,某些属性值包含引号(在值内)。

使用 XML::Twig,我看不出如何保留属性值周围存在的任何引号。

这是示例代码:

use strict;
use XML::Twig;

my $file=qq(<file>
  <label1 attr='This "works"!' />
  <label2 attr="This 'works'!" />
</file>
);

my $fixes=0; # count fixes
my $twig = XML::Twig->new( twig_handlers => { 
                             '[@attr]' => sub {fix_att(@_,\$fixes);} },
                             # ...
                           keep_atts_order => 1,
                           keep_spaces => 1,
                           keep_encoding => 1, );
#$twig->set_quote('single');

$twig->parse($file);
print $twig->sprint();

sub fix_att {
  my ($t,$elt,$fixes) =@_;
  # ...
}

上面的代码为 label1 返回了无效的 XML:

<label1 attr="This "works"!" />

如果我添加:

$twig->set_quote('single');

然后我们会看到 label2 的 XML 无效:

<label2 attr='This 'works'!' />

是否有保留现有报价的选项?还是有更好的方法来选择性地固定树枝?

4

1 回答 1

2

你有什么特别的理由要使用keep_encoding吗?没有它,报价将被正确编码。

keep_encoding用于保留文件的原始编码,但还有其他方法可以做到这一点。它主要用于 5.8 之前的时代,当时编码不像现在那样流畅。

于 2013-06-07T04:51:22.150 回答