3

无法使用 xlrd 复制 xlsx 和 xlsm 文件,因为它说“格式化 info = True”尚未实现,并且在执行以下操作时 openpyxl 内存不足:

import xlrd
from xlutils.copy import copy
from openpyxl import load_workbook

if file_format == 'xls':
        input_file=xlrd.open_workbook(input_file_location,formatting_info=True)
        wb = copy(input_file)
        wb.save(destination_file)
if file_format == 'xlsx' or file_format == 'xlsm' :
        input_file  =  load_workbook(input_file_location,data_only=True)
        input_file.save(destination_file)
4

1 回答 1

3

如果您只想复制文件,那么只需使用shutil. openpyxl 仍然不支持一些东西,例如会丢失的图像和图表。而且,正如您所看到的,内存是一个问题。每个单元使用大约 45 kB 的内存。

openpyxl 文档非常清楚打开工作簿时使用的不同选项:data_only 仅读取任何公式的结果并忽略公式。

如果要复制工作表,请参阅https://bitbucket.org/openpyxl/openpyxl/issue/171/copy-worksheet-function 。

否则,您可以使用两个工作簿,一个处于只读模式,另一个处于只写模式。但是如果要复制,最好在文件系统中完成。

如果您只想将值从一个工作簿复制到另一个工作簿,则可以结合只读和只写模式来减少内存占用。下面的伪代码应该给你一个基础。

wb1 = load_workbook("file.xlsx", read_only=True, data_only=True)
wb2 = Workbook(write_only=True)
for ws1 in wb1:
    ws2 = wb2.create_sheet(ws1.title)
    for r1 in ws1:
        ws2.append(r1) # this might need unpacking to use values
wb2.save("copy.xlsx")
于 2015-07-07T12:33:27.150 回答