我是新的 XML-Twig...我想要拆分 para 标记....
XML 文件:
<xml>
<p class="indent">text <i>text<i> incluce <div>text</div> ateas</p>
<p class="text">text text incluce <div>text</div> <b>ateas<b></p>
<p class="text">text <p>text</p> incluce <div>text</div> ateas</p>
</xml>
在这里,我想要拆分 Para 标签。我如何拆分以及如何在没有内联 para 标签和 div 标签的情况下分配 para 标签...
我需要输出为:
<xml>
<p class="indent">text <i>text</i> incluce</p>
<div>text</div>
<p class="indent">ateas</p>
<p class="text">text text incluce</p>
<div>text</div>
<p class="text"><b>ateas</b></p>
<p class="text">text</p>
<p>text</p>
<p class="text">incluce</p>
<div>text</div>
<p class="text">ateas</p>
</xml>
这个怎么分啊。。。。
脚本:
#!/usr/bin/perl
use warnings;
use strict;
use XML::Twig;
open(my $output , '>', "output.xml") || die "can't open the Output $!\n";
my $xml = XML::Twig->new( twig_handlers => { p => \&split_tag } );
$xml->parsefile("sample.xml");
$xml->print($output);
sub split_tag {
my ($twig, $p) = @_;
$_->wrap_in('p', $p->atts) for $p->children('#TEXT');
$p->erase;
}
但我无法获得提取输出.. 我该怎么做?