我正在使用重复数据删除库,在使用训练数据进行重复数据删除之前一切正常,但是在使用相同的数据集计算阈值时,它会出现以下错误:
deduper.threshold(data_d, recall_weight=2)
AttributeError: 'NoneType' object has no attribute 'indexAll'
我的数据集:
{23347895: {'Address': '100 Kanoki street drive',
'Id': '23347895',
'Name': 'kanoki',
'Unname': 'brunswick',
'no': '1',
'zip': '41092'},
2543294: {'Address': '1005 Main Street',
'Id': '2543294',
'Name': 'kushal gore',
'Unname': 'brunswick',
'no': '2',
'zip': '41093'}