19

我有一个在线商店,供应商可以在那里上传和导入两种格式的文章。

  1. 纯文本(制表符分隔)
  2. XML

目前我正在使用 XML 1.0。

但是我看到还有一个版本 1.1

在 wikipedia 上说,对于大多数用途,1.0 可以使用。http://en.wikipedia.org/wiki/XML#Versions

它还声明它使用以下 Unicode 编码:Unicode 2.0 到 Unicode 3.2。

在第五版中,XML 名称可能包含巴厘岛、占族或腓尼基文字中的字符以及自 Unicode 3.2 以来已添加到 Unicode 的许多其他字符

目前我只有几种基于“拉丁”的语言,但这可能会在未来发生变化,我想做好准备。

Unicode 3.2 中是否有某些语言不支持的字符?v1.0 对我使用安全吗?

如果您需要更多信息,请告诉我。

4

3 回答 3

25

使用版本 1.0。

如果您在标识符、EBCDIC 行结束字符或控制字符(字符代码 1 - 31)中使用某些非 ASCII 字符,则只需要使用 1.1 版。

XML 1.1 的基本原理和更改列表

于 2011-07-30T12:34:19.160 回答
11

XML 1.1 的出现源于对“包容性”的狂热渴望,它支持世界上所有的语言,包括近一个世纪前仅使用了 15 年的阿比西尼亚语的编写方法。如果您是 99.99999% 的不需要捕获古代手稿的人群中的一员,那么 XML 1.1 完全是在浪费时间。

于 2011-07-31T00:16:41.320 回答
9

Beyond non-useful things (like silly EBCDIC linefeeds), there is unfortunately one nice feature that XML 1.1 allows: ability to use character entities for Unicode/ASCII control characters other than LF/CR/Tab. Except that you still can not include nulls, even using character references.

So this is hardly enough to make one use 1.1, unless there is specific need to contain these characters.

于 2011-08-01T03:37:26.343 回答