我需要删除 XML 标记之间的任何内容,尤其是空格和换行符。
例如从以下位置删除空格和新闻行:
</node> \n<node id="whatever">
得到:
</node><node id="whatever">
这并不是为了手动解析 XML,而是在 XML 数据被工具解析之前准备好它。更具体地说,我使用 Hpricot (Ruby) 来解析 XML,不幸的是我们目前停留在 0.6.164 版本,所以......我不知道更新的版本,但是这个经常返回奇怪的节点(对象)仅包含空格和换行符。因此,想法是在将 XML 转换为 Hpricot 文档之前对其进行清理。替代解决方案表示赞赏。
一个测试示例: NoMethodError: undefined method `children' for "\n ":Hpricot::Text
这里有趣的部分不是 NoMethodError,因为这很好,但是 Hpricot::Text 元素只包含一个换行符和而已。