说我有边缘
A -> C
A -> D
A -> E
B -> D
B -> E
为了最大化数据局部性,我会安排 DAG 按此顺序存储在内存中(作为数组),以最小化节点与其依赖项之间的距离。
C, A, D, E, B
使得 A 到 C 的距离为 1,到 D 的距离为 1,到 E 的距离为 2。
B 到 E 的距离是 1,到 D 的距离是 2。
有这样做的算法的名称吗?如果没有,人们将如何实现这一点?
说我有边缘
A -> C
A -> D
A -> E
B -> D
B -> E
为了最大化数据局部性,我会安排 DAG 按此顺序存储在内存中(作为数组),以最小化节点与其依赖项之间的距离。
C, A, D, E, B
使得 A 到 C 的距离为 1,到 D 的距离为 1,到 E 的距离为 2。
B 到 E 的距离是 1,到 D 的距离是 2。
有这样做的算法的名称吗?如果没有,人们将如何实现这一点?
看起来你想要线性化 DAG。我不知道您是否将其用于依赖关系解析。Topological_sorting
你的问题看起来很熟悉。该程序tsort
也做了非常相似的事情。
然而,它是依赖线性化。
neel@gentoo:~$ tsort
C A
D A
E A
D B
E B
C
D
E
B
A
打印必须执行该任务的顺序。如果有循环,它可能不起作用。正如你提到的它的非循环的,它是相关的。
我不知道是否有任何这样的算法data locality ordering string
或类似的算法,但是看起来您的数据位置字符串有一些问题。
如果C
接近(1)A
并且也接近(1)B
并且B
太远(4),A
您将如何用您的数据位置字符串表示它?
我现在不知道你到底想做什么。如果您想线性化依赖关系以按正确顺序执行任务,请进行拓扑排序。
这是改善局部性的略有不同的方法:
http://ceur-ws.org/Vol-733/paper_pacher.pdf
所描述的算法似乎更接近于力导向的图形绘制算法而不是拓扑排序。
您还应该阅读有关内存图形数据库的论文,例如imGraph