我正在制作一个包含德语和法语内容的小网站。一些文档正确显示文本,即使所有变音符号都写为 äöü 而不是代码。其他文档需要代码,但我找不到文档之间的区别。
当试图用谷歌搜索答案时,我只能找到大量的代码参考,但没有解释为什么有些文档不需要它们。
任何 HTML 文档(或任何文本文档)都被编码为某种编码——这是字符和代表它们的值之间的映射。不同的编码意味着不同的字符。
许多页面使用 UTF-8 一种 Unicode 编码,它们在 HTTP 标头或页面本身的 Meta 标签(Content-Type)中声明 - 这样的页面可以直接使用大多数字符。
1) html-code (meta) 中的字符集声明 2) 文档的编码。例如...如果您使用 UTF-8 并且在 ISO 8859-1 中有一个文档(例如 js 文件),那么某些浏览器会向您显示 ISO 8859-1 中的站点,这会破坏您的 äöüß, ...
因为,根据HTML 规范:
创作工具(例如,文本编辑器)可以用他们选择的字符编码对 HTML 文档进行编码
一些文档使用可以直接表示字符的编码(例如iso-8859-1或Windows-1252或utf-8ä
) ;其他人使用无法使用的编码(例如us-ascii),因此需要使用字符实体引用ä
。