我有一个包含某些语言文本的 XML 文件。我想只用一种语言提取文本并将它们存储在一个单独的文件中。我怎样才能做到这一点?这是我的文件的一些开头行:
<?xml version="1.0" encoding="UTF-8"?>
<tmx version="1.4b">
<header creationtool="ORESAligner" creationtoolversion="1.0" datatype="plaintext" segtype="paragraph" adminlang="en-us" srclang="EN" o-tmf="ORES"/>
<body>
<tu tuid="55_100:6">
<prop type="session">55</prop>
<prop type="committee">3</prop>
<tuv xml:lang="EN">
<seg>RESOLUTION 55/100</seg>
</tuv>
<tuv xml:lang="AR">
<seg>القرار 55/100</seg>
</tuv>
<tuv xml:lang="ZH">
<seg>第55/100号决议</seg>
</tuv>
<tuv xml:lang="FR">
<seg>RÉSOLUTION 55/100</seg>
</tuv>
<tuv xml:lang="RU">
<seg>РЕЗОЛЮЦИЯ 55/100</seg>
</tuv>
<tuv xml:lang="ES">
<seg>RESOLUCIÓN 55/100</seg>
</tuv>
</tu>
</body>
</tmx>
现在说我只想要英文文本。所需的输出应该是:
RESOLUTION 55/100
我应该如何使用这个脚本?我是处理 XML 文件的新手,不知道如何使用这个 XPath 表达式。据我所知,xmlstarlet 能够修改 XML 文件。但我不知道怎么...?