0

我正在使用 Web-Harvest 来废弃网站并使用数据生成 xml 文件。

我有丑陋的节点<name> </name>,使用 normalize-space() 没有帮助,所以我在 Hex 视图中打开了文件,我发现它对应于'c2a0'。我四处寻找解决方案,但没有人帮助...

总而言之,我想要的是删除那个奇怪的空间(使用 xquery 或 xpath1/2),这样我就可以得到一个空节点<name/>

ps:使用的编码是'iso-8859-1'

4

1 回答 1

1

您可以使用translate删除某些字符。而utf8 c2a0是字符U+00A0,十六进制0xA0是160,所以可以用空格codepoints-to-string(160)来获取字符串。

一起:

translate(your node text, codepoints-to-string(160), "")
于 2012-08-01T12:43:49.643 回答