7

我想知道在 Haskell 中处理 Unicode XML 的官方解决方案是什么。我注意到 HXTString对文本使用简单的表示(Unicode 字符列表!!!)。

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors
XText String    ordinary text (leaf)
XBlob Blob          text represented more space efficient as bytestring (leaf)

解析时如何在两种表示之间进行选择?强制用户使用字符列表听起来并不是一个特别吸引人的功能,尤其是在 XML 文档包含大量文本内容的情况下。

另外,我在 Google 上找到了http://hackage.haskell.org/package/hxt-unicode,但不确定它是如何用于解析的。过去对 Unicode 的支持也更加明确:http ://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html 但是这个模块已在最新版本(撰写本文时为 9.3.1.0)中删除,原因不明。这背后的动机是什么?

有人可以提供一些示例代码,以及如何使用 HXT 吗?维基页面在这方面严重缺乏。谢谢你。

4

1 回答 1

3

xml-conduit包使用数据Text类型来存储文本数据。在过去的几年里,它已成为标准的文本数据表示。xml-conduit 是一个维护良好的包,我个人将它用于大量的开源和商业代码。

于 2012-10-06T17:36:37.403 回答