我正在尝试使用引擎中的方法读取二进制 Excel 文件,如下所示read_excel
:pandas
pyxlsb
import pandas as pd
df = pd.read_excel('test.xlsb', engine='pyxlsb')
如果xlsb
文件是这样的文件(现在,我正在通过 WeTransfer 共享此文件,但如果有更好的方法在 StackOverflow 上共享文件,请告诉我),返回的数据框将填充NaN
's. 我怀疑这可能是因为文件保存时活动单元格指向数据后的空单元格。所以我尝试了这个:
import pandas as pd
with open('test.xlsb', 'rb') as data:
data.seek(0,0)
df = pd.read_excel(data, engine='pyxlsb')
但它似乎仍然不起作用。我还尝试从字节数 0(从头开始)读取数据,将其写入新文件“test_1.xlsb”,最后使用 读取pandas
,但这不起作用。
with open('test.xlsb','rb') as data:
data.seek(0,0)
with open('test_1.xlsb','wb') as outfile:
outfile.write(data.read())
df = pd.read_excel('test_1.xlsb', engine='pyxlsb')
如果有人对可能发生的事情以及如何解决它有任何建议,我将非常感谢您的帮助。