我有一个 EBCDIC 编码(cp037)的二进制文件,其中包含可变长度记录。此文件中有不同类型的记录。使用 Python 我需要
- 从 cp037 转换为 UTF-8,处理压缩十进制数据的转换,使每条记录都有一个换行符
- 将每种记录类型写入其自己的输出文件 - 因此类型 30 记录转到type30.output文件
每条记录都有一个标题,其中包含记录的长度和记录类型,在以下布局中。
Offset Length Field
0 2 Record Length (binary)
5. 1. Record type (binary)
10. 4. Date (packed decimal in the form 0cyydddF)
etc....
每条记录可以是 100 字节长,其他短至 20 字节。我知道包含压缩十进制数据的任何字段的偏移量和长度。
对 Python 来说相对较新,因此非常感谢任何帮助。
谢谢。