1

我有一个二进制数据文件,采用相对古老的程序使用的格式,我正试图将其转换为理智的东西。在十六进制编辑器的帮助下,我基本上已经确定了文件格式,除了它包含带有奇怪编码的希伯来字符。

所有字符均为 8 位。“标准”27 个辅音(包括“最终”辅音)从十六进制 80 到 9A。然后有些元音似乎开始于十六进制 9B 左右(我猜是在标准辅音结束之后)。然后有似乎从十六进制 E0 开始的“点”辅音。

如果我没记错的话,我认为这是某种 DOS 编码。这是什么编码,我应该将它翻译成什么编码,以便以色列的用户能够最轻松地在 Microsoft Word 中打开它?有什么工具可以用来翻译吗?

4

1 回答 1

1

80 到 9A 似乎与CP862中的代码点匹配,但我找不到元音代码点的任何匹配项。我认为您应该做的只是对 Unicode进行自定义映射并以 UTF-8 或 UTF-16LE 纯文本文件生成输出。如果您添加 BOM(字节顺序标记),记事本和/或 Word 应该能够毫无问题地读取它。我可能会制作一个小的 Python 脚本,但在任何其他语言中应该不难。

于 2010-10-21T12:47:48.677 回答