我有一个程序可以创建多个 rdf 三元组的文本文件。我需要比较三元组并快速完成,最好的方法是什么?我曾想过将三元组放入一个数组并进行比较,但每个文件可能有数十万个三元组,这将花费很长时间。我需要它尽可能接近实时,因为三元组将在文件中不断进行分类。任何帮助都会很棒。这些文件也在 AllegroGraph 存储库中,如果以某种方式比较它们更容易的话。
一个想法:如果我将三元组存储在 excel 中(每行一个三元组)并且每个存储库一张表,
A:我怎样才能在表格中找到重复项。B:会不会很快。和 C:我怎样才能从 Java 自动化呢?