对于真正的大数据(例如超过 2^32 个元素和超过 2^32 对联合),是否有任何增强的不相交集算法?
显然最大的问题是我无法制作这么大的数组,所以我想知道是否有更好的算法或更好的数据结构来完成我的任务?
对于真正的大数据(例如超过 2^32 个元素和超过 2^32 对联合),是否有任何增强的不相交集算法?
显然最大的问题是我无法制作这么大的数组,所以我想知道是否有更好的算法或更好的数据结构来完成我的任务?
处理真正大数据的一种方法是在外部存储器中运行。http://terrain.cs.duke.edu/pubs/union-find.pdf (I/O-Efficient Batched Union-Find and Its Applications to Terrain Analysis) 包含理论算法,由相当复杂的调用序列组成到其他批处理算法,以及(第 3 节)一种自包含的递归算法,它的渐近效率不高,但看起来似乎很实用。