在 SQL 中实现 MHRW 算法是否可行且高效?
我想用 +100 万个节点对直接大图进行采样,这似乎是最好的方法之一。该算法的目的是用于无向图,但我认为它也适用于有向图
算法:
v <- initial node
while stop criteria not met do
select node w uniformly at random from neighbors of v;
generate uniformly at random 0<= p <= 1
if p <= (degree of v) / (degree of w)
then v <- w
else
stay at v
end if
end while
我从 table1 中获取初始节点,其中包含所有节点及其属性。在 table2 中,我有两列显示节点之间的所有连接(以及一种获取节点度的方法)。停止标准是样本的大小,即样本 <= ~100.000 个节点。
此致。