我在读取 xls 文件时遇到错误,错误如下所述
**XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle'**
我尝试了各种解决方案,但最终没有运气其他工具,如 xlrd,pyexcel,但仍然面临这个错误。希望有人有解决这个问题的方法。我也尝试使用 pythons io 库将它作为原始文件读取,但问题文件中是否有多个工作表需要维护顺序
我在读取 xls 文件时遇到错误,错误如下所述
**XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'\x08jstanle'**
我尝试了各种解决方案,但最终没有运气其他工具,如 xlrd,pyexcel,但仍然面临这个错误。希望有人有解决这个问题的方法。我也尝试使用 pythons io 库将它作为原始文件读取,但问题文件中是否有多个工作表需要维护顺序
2).XLS 文件如果您明确应用工作簿密码并且如果您使用密码保护某些工作表元素,则会被加密。因此,即使您不需要密码来打开它,也可以拥有一个加密的 XLS 文件。
file1 = io.open(filename, "r", encoding="utf-8")
data = file1.readlines()
# Creating a workbook object
xldoc = Workbook()
# Adding a sheet to the workbook object
sheet = xldoc.add_sheet("Sheet1", cell_overwrite_ok=True)
# Iterating and saving the data to sheet
for i, row in enumerate(data):
# Two things are done here
# Removeing the '\n' which comes while reading the file using io.open
# Getting the values after splitting using '\t'
for j, val in enumerate(row.replace('\n', '').split('\t')):
sheet.write(i, j, val)
# Saving the file as an excel file
您下载的文件也将是 html。使用下面的代码片段来验证一个文件。
import pandas as pd
df_list = pd.read_html('filename.xlsx')
df = pd.DataFrame(df_list[0])