我在一个目录下的不同子文件夹中有一些 17K 文件,我尝试了下面的代码,但这花费了太多时间并且读取文件非常耗时。扩展文件XLSB
只有:
import os
import shutil
import pandas as pd
#from pyxlsb import open_workbook as open_xlsb
#!pip install pyxlsb
from pyxlsb import open_workbook
rootdir= 'C:/Users/akuma45/Desktop/a'
rootdir1= 'C:/Users/akuma45/Desktop/b'
for subdir,dirs, files in os.walk(rootdir):
for file in files:
c=(os.path.join(subdir, file))
try:
df=pd.read_excel(c, engine='pyxlsb')
except:
continue
if df.empty==False:
shutil.copy(c, rootdir1)