我收到了文件,遗憾的是,我无法获得有关它们是如何生成的信息。我需要解析这些文件。
除了一个字符之外,该文件完全是 ASCII:0xDB(十进制为 219)。
显然(从查看文件)这个字符是一个货币符号。我知道是因为:
- 这些文件必须在金额出现的任何地方包含货币符号
- 文件中没有其他货币符号(既不是 $ 也不是欧元也不是什么都没有)
- 每次出现 0xDB 时,它都会靠近一个数量
我认为在这些文件中 0xDB 应该代表欧元符号(实际上这个 0xDB 很可能出现在应该出现欧元符号的任何地方)。
文件命令说明了这些文件:
ISO-8859 English text, with CRLF, LF line terminators
一个hexdump给出了这个:
00000030 71 75 61 6e 74 20 db 32 2e 36 30 0a 20 41 49 4d |quant .2.60. AIM|
^^ ^
这些文件都是正常格式化/可解析的。实际上,除了那个奇怪的 0xDB 字符之外,我得到的所有信息都很好。
有谁知道发生了什么?货币符号(据说是欧元符号)是如何变成 0xDB 的?
它既不是 ISO-8859-1(又名 ISO Latin 1)也不是 ISO-8859-15,因为在这两种情况下,代码点 219 都对应于 'Û' (就像 Unicode 代码点 219 是'LATIN CAPITAL LETTER U WITH CIRCUMFLEX')。
它不是扩展的ASCII。