2

我想读取一个包含标题部分(文本)和数字数组的二进制数据文件。我可以使用 f.read(block_size) 在标题部分保持流式传输,但是读取数字数组的最佳方法是什么?

在 MatLab 中,我可以做

fid = fopen(data_file_name, 'rb');
line = fread(fid, block_size, '*char'); 
data = fread(fid, 'long');

在 Python 中,我所做的是

f = open(data_file_name, 'rb')
header = f.read(block_size)

从这里我不知道如何到达数字数组。

4

1 回答 1

5

您可以使用struct.unpack来解压缩数字数据。

例如

with open('file','rb') as fin:
    header = fin.read(header_size)
    data_str = fin.read(num_data_bytes)
    data_tuple = struct.unpack('100f',data_str)  #100 4-byte floats

根据数据,您可以使用numpy.fromfile. 该函数接受一个打开的文件对象,因此您可以读取标头,然后将打开的文件对象传入,以便 numpy 可以读取数据。在这个问题中,我询问了将二进制数据从字符串读取到 numpy 数组的详细信息。这是一个略有不同的问题,但那里的大部分答案也适用于此(如何指定字节顺序等)

于 2013-04-02T14:48:11.820 回答