xml - 从 xml 节点中删除奇怪的空间 (xPath/xQuery)

Question

我正在使用 Web-Harvest 来废弃网站并使用数据生成 xml 文件。

我有丑陋的节点<name> </name>，使用 normalize-space() 没有帮助，所以我在 Hex 视图中打开了文件，我发现它对应于'c2a0'。我四处寻找解决方案，但没有人帮助...

总而言之，我想要的是删除那个奇怪的空间（使用 xquery 或 xpath1/2），这样我就可以得到一个空节点<name/>

ps：使用的编码是'iso-8859-1'

score 1 · Accepted Answer

您可以使用translate删除某些字符。而utf8 c2a0是字符U+00A0，十六进制0xA0是160，所以可以用空格codepoints-to-string(160)来获取字符串。

一起：

translate(your node text, codepoints-to-string(160), "")

1 回答 1