我有一个文本文件如下:
1 3
2 5
3 6
4 5
5 4
6 1
7 2
上面的文件表示无向图中的边。我想删除图中的重复边。在上面给出的示例中,我想删除其中任何一个4,5 or 5,4
,因为它们在图中表示相同的边,因此会导致重复。我正在尝试使用Apache Spark 中Graphstream
的库来可视化文件中的图形。GraphX
但是由于存在如上所述的重复节点,它会给出如下错误
org.graphstream.graph.EdgeRejectedException: Edge 4[5--4] was rejected by node 5
从文本文件中删除此类重复项的最佳方法是什么?