我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。我注意到 HXTString
对文本使用简单的表示(Unicode 字符列表!!!)。
Constructors
XText String ordinary text (leaf)
XBlob Blob text represented more space efficient as bytestring (leaf)
解析时如何在两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别吸引人的功能,尤其是在 XML 文档包含大量文本内容的情况下。
另外,我在 Google 上找到了http://hackage.haskell.org/package/hxt-unicode,但不确定它是如何用于解析的。过去对 Unicode 的支持也更加明确:http ://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但是这个模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。这背后的动机是什么?
有人可以提供一些示例代码,以及如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢你。