从 xlsx 文件中读取数据(仅 20000 个数字)需要很长时间:
import pandas as pd
xlsxfile = pd.ExcelFile("myfile.xlsx")
data = xlsxfile.parse('Sheet1', index_col = None, header = None)
大约需要 9 秒。
如果我以 csv 格式保存相同的文件,则需要大约 25 毫秒:
import pandas as pd
csvfile = "myfile.csv"
data = pd.read_csv(csvfile, index_col = None, header = None)
这是 openpyxl 的问题还是我错过了什么?有没有其他选择?