对于第二种情况:
本网站使用Windows-1256(阿拉伯语)编码,但错误地声明使用ISO 8859-1(拉丁/西欧)编码。如果您查看源代码,您可以看到它<meta ... charset=ISO-8859-1" />
在其标题中声明。
因此,发生的情况是服务器向您的浏览器发送了一个使用 Windows-1256 编码的 HTML 文件,但您的浏览器使用 ISO 8859-1 解码此文件(因为这是文件声称的内容)。
对于ASCII 字符,这没有问题,因为它们在两种编码中的编码相同。但是,阿拉伯字符并非如此:对应于阿拉伯字符(由 Windows-1256 编码)的每个代码字节都映射到 ISO 8859-1 编码的某个拉丁字符,而这些乱码拉丁字符就是您所看到的阿拉伯语文本。
如果您想正确显示本网站的所有文本,您可以手动设置您的浏览器用来解码本网站的字符编码。
例如,您可以通过安装设置字符编码扩展来使用Chrome,然后右键单击该网站并选择:
设置字符编码 > 阿拉伯语 (Windows-1256)
在Safari中,您只需选择:
查看 > 文本编码 > 阿拉伯语 (Windows)。
其他浏览器(例如 Firefox 或 Internet Explorer)也应该可以做到这一点......
对于第一种情况:
您的网站(您的服务器发送到浏览器的 HTML 文件)使用 UTF-8 编码。但是,这个 HTML 文件不包含任何编码声明,所以浏览器不知道这个文件是用哪种编码编码的。
在这种情况下,浏览器可能会使用默认编码来解码文件,通常是ISO 8859-1 / Windows-1252(拉丁/西欧)。结果与上述情况相同:所有阿拉伯字符都被解码为乱码拉丁字符。
要解决此问题,您必须通过在文件头中添加以下标记来声明您的 HTML 文件使用 UTF-8 编码:
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">