我正在尝试创建一个进度条,用于使用 tqdm 将 excel 数据读入 pandas。我可以使用 csv 使用 chunksize 参数轻松地做到这一点,如下所示:
data_reader = pd.read_csv(path,
chunksize = 1000)
for row in tqdm(data_reader,
total = 200):
df_list = []
df_list.append(row)
它会更新 200 个总块中每 1000 个块的进度条。pd.read_excel
,然而,不再有chunksize
论据。有替代方案吗?
编辑:我已经阅读了问题 re: reading an excel file in chunks ( Reading a part of a large xlsx file with python ),但是,read_excel不再有 chunksize 参数并且pd.ExcelFile.parse
是等效的。我想知道是否有chunksize
参数的替代方法或另一种方法来创建可迭代的以在读取块时循环它们。