python - 使用 pyxlsb 使用 Pandas read_excel 读取 XLSB（二进制）文件会读取某些 xlsb 文件的空行

翻译自：https://stackoverflow.com/questions/61846176 2020-05-17T02:20:45.453

2116 次

我正在尝试使用引擎中的方法读取二进制 Excel 文件，如下所示read_excel：pandaspyxlsb

import pandas as pd
df = pd.read_excel('test.xlsb', engine='pyxlsb')

如果xlsb文件是这样的文件（现在，我正在通过 WeTransfer 共享此文件，但如果有更好的方法在 StackOverflow 上共享文件，请告诉我），返回的数据框将填充NaN's. 我怀疑这可能是因为文件保存时活动单元格指向数据后的空单元格。所以我尝试了这个：

import pandas as pd
with open('test.xlsb', 'rb') as data:
    data.seek(0,0)
    df = pd.read_excel(data, engine='pyxlsb')

但它似乎仍然不起作用。我还尝试从字节数 0（从头开始）读取数据，将其写入新文件“test_1.xlsb”，最后使用读取pandas，但这不起作用。

with open('test.xlsb','rb') as data:
    data.seek(0,0)
    with open('test_1.xlsb','wb') as outfile:
        outfile.write(data.read())
df = pd.read_excel('test_1.xlsb', engine='pyxlsb')

如果有人对可能发生的事情以及如何解决它有任何建议，我将非常感谢您的帮助。

python - 使用 pyxlsb 使用 Pandas read_excel 读取 XLSB（二进制）文件会读取某些 xlsb 文件的空行

0 回答 0

Related

Reference