7

我认为这个问题很简单,在基本平面之后我是否需要 Unicode 中的所有其他东西?包括什么样的东西,真的需要吗?(以及出于什么目的?)

谢谢。

4

4 回答 4

11

如果您打算在中国销售任何东西,那么 GB 18030 标准是强制性的,并且需要 BMP(基本多语言平面)以外的字符。该标准是强制执行的,为了在那里销售,您需要通过 GB 18030 认证。

日本和香港也有国家标准要求字符超出 BMP。即使这些标准不像中国标准那样强制执行,支持它们也可能会给您带来一些优势。

所以简单的答案是:你需要那里的一些东西。

=== 2016 ===

那是7年前的事了。现在每个人都在谈论表情符号。好吧,大多数表情符号都超出了 BMP :-)

于 2009-11-11T08:11:51.413 回答
7

这取决于您是否控制数据。如果您使用来自您以外的任何人的 Unicode 数据,您通常必须假设它可能包含补充字符,这反过来意味着您需要处理 4 字节 UTF-8、UTF-16 代理字符等。

于 2009-06-21T11:41:44.223 回答
3

如果可能,您应该尝试支持所有 Unicode,包括补充平面。现在有活的语言坐在像这样的辅助位面。未来会增加其他生活语言,部分语言目前需要补充私人使用区域。然后还有米海妮塔在他的回答中所说的。

MySQL 从 5.5 开始也支持辅助平面。

最好现在花一点时间来完全支持 Unicode,这样将来如果您确实需要它就不会遇到问题。而且您不知道谁将使用您的软件以及他们将来将使用哪些脚本。现在大部分的渲染引擎、GUI 工具包、浏览器、操作系统等都会毫无问题地支持这一点。

虽然这个问题是几年前提出的,但我在搜索时遇到了这个问题,从那时起情况发生了变化。我目前正在处理程序员认为不需要补充平面支持或未经测试的问题。

于 2012-03-01T07:54:58.543 回答
1

请参阅字符图表的完整列表

补充字目前包含古文字。除非您的应用程序可以处理古代文字,例如 Kharoshthi、Old Persion 和 Cuneiform,否则可能不会

我猜你只有在遇到不完整的 UTF-8 或 UTF-16 实现时才需要处理这个问题。UTF-8 的一些实现不支持 4 字节字符,这是补充平面:U+10000 以上的字符。我想到了MySQL 。

于 2009-06-21T11:31:39.343 回答