当我需要向用户输出某些内容时,我知道我在使用 Unicode 和编码为 UTF-8 时,我对我的 Python 世界感到很高兴。然后,我的一位同事给我发了“The UTF-8 Everywhere' manifesto”(2012 年),这让我很困惑。
- 这篇文章的作者多次声称 UCS-2(Python 使用的 Unicode 表示)是 UTF-16 的同义词。
- 他甚至直接说 Python 使用 UTF-16 进行内部字符串表示。
- 作者还承认自己是 Windows 爱好者和开发人员,并指出 MS 多年来处理字符编码的方式导致该组最困惑,所以也许这只是他自己的困惑。我不知道...
有人可以解释一下 UTF-16 与 Unicode 在 Python 中的状态吗?它们是同义词吗?如果不是,以什么方式?