3

前段时间,我在一个文档中看到了“v3/43/4r”的文字。

我知道它来自“vóór”(荷兰语强调重音),我想知道是哪个编码失败导致了这个错误。

4

1 回答 1

4

前段时间我写了一个程序,可以半自动地进行这种分析(也许我会在一段时间内发布它......),这就是结果,有点想象力:

  • ó:是 U+00F3,在许多不同的编码(大多数 ISO-8859-* 和大多数西方 Windows-*)中占用相同的代码点 (0xF3)。
  • 在 CP850 中,codepint 0xF3 是 ¾ (U+00BE),即四分之三字符。在其他较少使用的代码页(CP775、CP856、CP857、CP858)中也是如此。
  • 当字符不直接可用时,¾ 有时会音译为 3/4。

你来了!“vór” -> “v¾¾r” -> “v3/43/4r”。

第一部分(ó -> ¾)是西方 Windows 版本(在我的国家 ANSI=Windows-1252,OEM=CP850)中 ANSI 与 OEM 代码页的常见损坏。您可以轻松地看到它使用 NOTEPAD 创建文件,vóór在命令提示符下使用type.

于 2013-07-15T13:14:14.827 回答