我创建了一个使用DUKE查找重复记录的应用程序 代码:
public static void main(String[] args) throws IOException, SAXException
{
Configuration config =
ConfigLoader
.load("<path>/src/main/recources/namebase.xml");
Processor proc = new Processor(config);
proc.addMatchListener(new PrintMatchListener(true, true, true, true, config.getProperties(),
true));
proc.deduplicate();
proc.close();
}
它现在工作正常,可能用例是查找重复记录并删除它们。PrintMatchListener 只能打印记录。所以我有两个问题:
- 如何对重复记录执行操作?
- 重复的逻辑是说记录'A'与'B'相似,它也说'B'与'A'相似。我只需要一种方式关系,以便我可以删除这些记录。任何人都可以提出任何策略。