-1

我编写了一个 awk/shell 脚本来处理输入 xml 文件并输出另一个包含所需元素的 xml 文件。虽然此脚本有效,但我想对其进行简化,以便不使用任何临时文件,而是在命令之间通过管道输出。这是脚本。

#extract elements
awk 'BEGIN {FS="[<|>]"} /(elementname).*$/{matchingstring=$0}
{ printf "%s\n", matchingstring}'   input.xml > tmp.xml

#sort, uniq, append closing tag (/>) 
for i in `cat tmp.xml | awk '{print $2}' |sort | uniq `; do grep -m 1  $i tmp.xml; 
done | sort -r  | sed "s/>$/\/>/" > tmp2.xml

# Append xml header and root element
awk 'BEGIN { 
FS="[<|>]"} 
NR==1{
    print "<?xml version=\"1\.0\" encoding=\"UTF\-8\"?>"
    print "<listofelements>"
};
{ printf "%s\n", $0 }
END {   print "</listifelements>";}' tmp2.xml > final.xml 

任何输入将不胜感激。

4

1 回答 1

0

其中一项改进是:

awk 'BEGIN {FS="[<|>]"} /(elementname).*$/{matchingstring=$0}
{ printf "%s\n", matchingstring}'   input.xml > tmp.xml

可以替换为:

awk '/(elementname).*$/' input.xml > tmp.xml

还有下面这个:

awk 'BEGIN { 
FS="[<|>]"} 
NR==1{
    print "<?xml version=\"1\.0\" encoding=\"UTF\-8\"?>"
    print "<listofelements>"
};
{ printf "%s\n", $0 }
END {   print "</listifelements>";}' tmp2.xml > final.xml 

可以改为:

awk 'BEGIN { 
print "<?xml version=\"1\.0\" encoding=\"UTF\-8\"?>";
print "<listofelements>"} 
END {print "</listifelements>";}1' tmp2.xml > final.xml
于 2013-08-06T06:59:25.507 回答