Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 Web-Harvest 来废弃网站并使用数据生成 xml 文件。
我有丑陋的节点<name> </name>,使用 normalize-space() 没有帮助,所以我在 Hex 视图中打开了文件,我发现它对应于'c2a0'。我四处寻找解决方案,但没有人帮助...
<name> </name>
总而言之,我想要的是删除那个奇怪的空间(使用 xquery 或 xpath1/2),这样我就可以得到一个空节点<name/>
<name/>
ps:使用的编码是'iso-8859-1'
您可以使用translate删除某些字符。而utf8 c2a0是字符U+00A0,十六进制0xA0是160,所以可以用空格codepoints-to-string(160)来获取字符串。
translate
codepoints-to-string(160)
一起:
translate(your node text, codepoints-to-string(160), "")