我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。我注意到 HXTString对文本使用简单的表示(Unicode 字符列表!!!)。
Constructors
XText String ordinary text (leaf)
XBlob Blob text represented more space efficient as bytestring (leaf)
解析时如何在两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别吸引人的功能,尤其是在 XML 文档包含大量文本内容的情况下。
另外,我在 Google 上找到了http://hackage.haskell.org/package/hxt-unicode,但不确定它是如何用于解析的。过去对 Unicode 的支持也更加明确:http ://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但是这个模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。这背后的动机是什么?
有人可以提供一些示例代码,以及如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢你。