2

我编写了一个脚本,它读取 XML 文件并将相关数据输出到 TSV 文件。我正在将其转换为使用 openpyxl 编写 XLSX 文件。每当我在脚本末尾保存我的工作簿时,它会在保存时挂起 30 多秒。我假设这是由于我正在写入大量数据(10144 行到列 'BG' )。有什么方法可以优化它以使保存更快,或者在我生成文件时直接写入文件,这样最后就不必像这样保存了?

4

1 回答 1

2

很难说你的问题到底是什么,但你应该尝试的第一件事是使用openpyxl 优化的 writer

from openpyxl import Workbook
wb = Workbook(optimized_write = True)

ws = wb.create_sheet()

# now we'll fill it with 10k rows x 200 columns
for irow in xrange(10000):
    ws.append(['%d' % i for i in xrange(200)])

wb.save('new_big_file.xlsx') # don't forget to save!

另外,考虑在模式下切换到xlsxwriter (请参阅docs)。constant_memory

希望有帮助。

于 2013-07-22T17:02:35.293 回答