9

我的 HTML 页面使用<meta charset="windows-1252">.

  1. 正在更改为UTF-8推荐,为什么?
  2. 我检查了我的一些页面,UTF-8并得到了带有一些数学符号的问号。EG:x 应更改为 × 才能正确显示。我试过了,CpConverter但它并没有很好地转换所有符号。

有没有更好的方法来转换许多文件?

4

3 回答 3

19
  1. UTF-8是普遍认可的标准,适用于任何地方。Windows-any 编码是特定于 Windows 的,不保证可以在任何机器上工作。另外,看看这里这里
  2. 如果要更改文件的编码,可以通过多种方式进行。您可以在文本编辑器/IDE 中查找编码类型或使用以下命令(未经测试,但应该可以使用):

iconv -f WINDOWS-1252 -t UTF-8 filename.txt

于 2013-05-08T19:19:06.297 回答
0

你的第一个问题的答案是肯定的。建议您绝对更改所有 HTML 5 文档的所有字符编码属性。

这是因为它是当前 W3C 的 HTML5 标准。我会仅基于这个原因更改任何给定站点中的所有页面,因为所有标记呈现的标准化是不可避免的。

这可以在任何具有查找/替换功能的编辑器上轻松完成。只需使用该功能在每个文档中查找术语

<meta charset="windows-1252">

并将其替换为

<meta charset="utf-8"/>

UTF-8 字符编码应该能够处理您的数学字符,但如果它不能简单地保留您的原始字符集。剩下的只有文本的页面,您需要更改为 UTF-8。这是 W3Schools 在您的字符编码上的位置。

HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集,它涵盖了世界上几乎所有的字符和符号!-- W3Schools.com

如果大小是一个问题,那么您只会将那些具有特殊数学字符要求的文档保留在原始编码中,如果它们不能正确呈现并且我认为它不会影响您的浏览器加载时间足以损坏您的 SEO。如果您有许多带有数学符号的页面,那么如果您正在寻找一个受欢迎的网站或商业网站,这可能是一个问题,如果不是这样,文件大小的问题似乎就没有问题了。

对于其他文档,即使您有 BOM,您仍应将它们的编码更改为 UTF-8。

如果文件开头有 UTF-8 字节顺序标记 (BOM),则 Internet Explorer 10 或 11 以外的最新浏览器版本将使用它来确定页面的编码是 UTF-8。它的优先级高于任何其他声明,包括 HTTP 标头。

如果您有 BOM,您可以跳过元编码声明,但我们建议您保留它,因为它可以帮助人们查看源代码来确定页面的编码是什么。-- w3.org

祝你好运,编码愉快!:-)

于 2021-04-25T02:32:23.027 回答
-5

这是一个老问题,但我的回答可能会帮助某人做出更好的决定。

从 ANSI(windows-1252) 更改为 UTF-8 大约会使 HTML 文件的大小增加一倍。(取决于文件中使用的字符)

如果您想对此进行测试,只需在记事本中创建一个包含以下字符的文件:

回复

这些字符同时采用 ANSI(Windows-1256) 和 Unicode。使用 ANSI(Windows-1256) 编码保存文件一次,再使用 UTF-8 编码保存文件。

UTF-8 文件大小:9 个字节

ANSI(Windows-1256) 文件的大小:3 个字节

如果您想更改页面的字符集,只需在记事本或任何其他编辑器中打开它们并保存为 UTF-8 编码。

于 2018-02-05T22:43:18.313 回答