0

现在我要说可怕的“E”字。编码。我知道它已经在整个互联网上被覆盖 ,但有几件事我需要澄清。

现在我有一个脚本,其字符集为 ISO-8559-1,并且它写入了一系列 latin1_swedish_ci 字段。这些字段中的数据虽然不准确,但我在字符串中得到了 ê 和 çà 之类的符号。这些显然是“非标准”字符。

现在说到输出,如果我在 ISO-8859-1 中提供我的 HTML,我的内容将无法正确呈现,但是当我使用 UTF-8 时,大部分内容都会正确呈现。

现在的问题:

  1. 我假设数据库将数据错误地存储在人眼中,因为它需要使用多个字节,这是正确的吗?

  2. 为什么大多数符号在使用 UTF-8 字符集时可以正确呈现,但在使用 ISO 时却不能?

  3. 为了让所有字符保存在数据库中并正确呈现,我假设我需要始终使用 UTF-8。展望未来,您是否会受到打击,或者是否可以将此类数据保存在数据库中并每次都进行转换。我们有很多很多非英语字符。

谢谢

理查德

4

1 回答 1

0

所有排序,我已经在博客中介绍了这里采取的步骤:https: //support.servertastic.com/converting_latin1_utf8/

于 2013-03-25T15:13:18.230 回答