我在大数据分析中遇到了一个问题,我正在使用 Dijkstras 算法找出具有超过 175K 个节点的图的路径。但问题是我不知道特定源和目的地是否存在路径。我必须为大约 1000 个来源和目的地执行此操作。但是我不能随机选择它们,因为我不确定它们之间是否存在路径。我不确定如何处理。在 MapReduce 环境中执行一次算法在本地需要大约 15 分钟的时间。因此,反复试验不是一种选择。只有我能找到至少 1000 个源和目标是找到循环(?)或强连接组件?这个对吗 ?我希望我的问题很清楚。
我基本上是在寻找说 1000 对源和目的地,它们的路径存在于该大小的图中