在阅读了 Joel 关于 Unicode 的文章后,我仍然对自己的 unicode 知识感到非常不确定。具体来说,我留下了这个问题:
假设我有一个代码点太大而无法适应某些编码(即 ASCII)的字符串,例如:
U+67CF U+1AAB U+ABCD U+7034
然后乔尔说:
如果你试图在你试图表示它的编码中表示的 Unicode 代码点没有等价物,你通常会得到一个小问号:?或者,如果你真的很好,一个盒子。
但是这个字符串看起来像什么(在二进制/十六进制级别)以 ASCII 编码或其他一些大小不足的编码?