0

我创建了一个使用DUKE查找重复记录的应用程序 代码:

public static void main(String[] args) throws IOException, SAXException
{
     Configuration config =
                ConfigLoader
                    .load("<path>/src/main/recources/namebase.xml");
            Processor proc = new Processor(config);
            proc.addMatchListener(new PrintMatchListener(true, true, true, true, config.getProperties(),
                true));
            proc.deduplicate();

            proc.close();
}

它现在工作正常,可能用例是查找重复记录并删除它们。PrintMatchListener 只能打印记录。所以我有两个问题:

  • 如何对重复记录执行操作?
  • 重复的逻辑是说记录'A'与'B'相似,它也说'B'与'A'相似。我只需要一种方式关系,以便我可以删除这些记录。任何人都可以提出任何策略。
4

0 回答 0