0

我正在尝试在具有三张工作表的 Excel 工作表上运行此代码。表 1 - 包含 18000 行表 2 - 包含 6500 行表 3 - 包含 2500 行

我想通过比较主文件中的关键字来掩盖敏感信息。然而,这段代码永远只在一个函数上运行——

wb= openpyxl.load_workbook("NewContent.xlsx")

from fuzzywuzzy import fuzz

length = len(wb.sheetnames)

def comp():
    for num in range(0, length, 1):
        wb.active = num
        sheet = wb.active

        max_row=sheet.max_row
        max_column=sheet.max_column

        cmp = pd.read_excel('Client_names.xlsx', sheet_name=0)
        mylist = cmp['ClientName'].tolist()

        for i in range(2,max_row+1):
             for j in range(1,max_column+1):
                  cell_obj=sheet.cell(row=i,column=j)
                  for k in range(0, len(mylist), 1):
                     if fuzz.token_sort_ratio(cell_obj.value, mylist[k]) > 80:
                         cell_obj.value = 'Company'
                         wb.save('NewContent_Masked.xlsx')
                         break


comp()

优化代码的任何替代方案

4

0 回答 0