我正在尝试在具有三张工作表的 Excel 工作表上运行此代码。表 1 - 包含 18000 行表 2 - 包含 6500 行表 3 - 包含 2500 行
我想通过比较主文件中的关键字来掩盖敏感信息。然而,这段代码永远只在一个函数上运行——
wb= openpyxl.load_workbook("NewContent.xlsx")
from fuzzywuzzy import fuzz
length = len(wb.sheetnames)
def comp():
for num in range(0, length, 1):
wb.active = num
sheet = wb.active
max_row=sheet.max_row
max_column=sheet.max_column
cmp = pd.read_excel('Client_names.xlsx', sheet_name=0)
mylist = cmp['ClientName'].tolist()
for i in range(2,max_row+1):
for j in range(1,max_column+1):
cell_obj=sheet.cell(row=i,column=j)
for k in range(0, len(mylist), 1):
if fuzz.token_sort_ratio(cell_obj.value, mylist[k]) > 80:
cell_obj.value = 'Company'
wb.save('NewContent_Masked.xlsx')
break
comp()
优化代码的任何替代方案