0

我正在尝试使用引擎中的方法读取二进制 Excel 文件,如下所示read_excelpandaspyxlsb

import pandas as pd
df = pd.read_excel('test.xlsb', engine='pyxlsb')

如果xlsb文件是这样的文件(现在,我正在通过 WeTransfer 共享此文件,但如果有更好的方法在 StackOverflow 上共享文件,请告诉我),返回的数据框将填充NaN's. 我怀疑这可能是因为文件保存时活动单元格指向数据后的空单元格。所以我尝试了这个:

import pandas as pd
with open('test.xlsb', 'rb') as data:
    data.seek(0,0)
    df = pd.read_excel(data, engine='pyxlsb')

但它似乎仍然不起作用。我还尝试从字节数 0(从头开始)读取数据,将其写入新文件“test_1.xlsb”,最后使用 读取pandas,但这不起作用。

with open('test.xlsb','rb') as data:
    data.seek(0,0)
    with open('test_1.xlsb','wb') as outfile:
        outfile.write(data.read())
df = pd.read_excel('test_1.xlsb', engine='pyxlsb')

如果有人对可能发生的事情以及如何解决它有任何建议,我将非常感谢您的帮助。

4

0 回答 0