ruby - 我的天真的最大派系发现算法比 Bron-Kerbosch 的运行得更快。怎么了？

Question

简而言之，我的幼稚代码（在 Ruby 中）看起来像：

# $seen is a hash to memoize previously seen sets
# $sparse is a hash of usernames to a list of neighboring usernames
# $set is the list of output clusters

$seen = {}
def subgraph(set, adj)
    hash = (set + adj).sort
    return if $seen[hash]
    $sets.push set.sort.join(", ") if adj.empty? and set.size > 2
    adj.each {|node| subgraph(set + [node], $sparse[node] & adj)}
    $seen[hash] = true
end

$sparse.keys.each do |vertex|
    subgraph([vertex], $sparse[vertex])
end

还有我的 Bron Kerbosch 实现：

def bron_kerbosch(set, points, exclude)
    $sets.push set.sort.join(', ') if set.size > 2 and exclude.empty? and points.empty?
    points.each_with_index do |vertex, i|
        points[i] = nil
        bron_kerbosch(set + [vertex],
                      points & $sparse[vertex],
                      exclude & $sparse[vertex])
        exclude.push vertex
    end
end

bron_kerbosch [], $sparse.keys, []

我还实现了旋转和退化排序，这减少了 bron_kerbosch 的执行时间，但不足以超越我最初的解决方案。情况似乎是错误的；我缺少什么算法洞察力？如果您需要查看完整的工作代码，这里有一个更详细的文章。我已经在大小达到一百万左右的伪随机集上对此进行了测试。

score 4 · Accepted Answer

我不知道您如何为测试生成随机图，但我想您使用的函数根据均匀分布生成一个数字，因此您获得了一个非常均匀的图。这是在图上测试算法时的常见问题，很难创建好的测试用例（通常与解决原始问题一样难）。

max-clique 问题是一个著名的 NP 难题，两种算法（朴素算法和 Bron Kerbosch 算法）具有相同的复杂性，因此我们不能期望对所有测试用例进行全局改进，而只是对某些特定情况进行改进. 但是因为您使用均匀分布来生成图表，所以您没有这种特殊情况。

这就是为什么两种算法的性能在您的数据上非常相似的原因。而且因为 Bron Kerbosch 算法比朴素算法稍微复杂一点，所以朴素算法更快。

ruby - 我的天真的最大派系发现算法比 Bron-Kerbosch 的运行得更快。怎么了？

1 回答 1

Related

Reference