9

我有一个康威生命游戏的实现。如果可能的话,我想通过使用并行性来加速它。

life :: [(Int, Int)] -> [(Int, Int)]
life cells = map snd . filter rules . freq $ concatMap neighbours cells
    where rules (n, c) = n == 3 || (n == 2 && c `elem` cells)
          freq = map (length &&& head) . group . sort

parLife :: [(Int, Int)] -> [(Int, Int)]
parLife cells = parMap rseq snd . filter rules . freq . concat $ parMap rseq neighbours cells
    where rules (n, c) = n == 3 || (n == 2 && c `elem` cells)
          freq = map (length &&& head) . group . sort

neigbours :: (Int, Int) -> [(Int, Int)]
neighbours (x, y) = [(x + dx, y + dy) | dx <- [-1..1], dy <- [-1..1], dx /= 0 || dy /= 0]

在分析中,邻居占了所花费时间的 6.3%,所以虽然很小,但我预计通过并行映射它会显着加快速度。

我用一个简单的功能进行了测试

main = print $ last $ take 200 $ iterate life fPent
    where fPent = [(1, 2), (2, 2), (2, 1), (2, 3), (3, 3)]

并将并行版本编译为

ghc --make -O2 -threaded life.hs

并将其作为

./life +RTS -N3

事实证明,并行版本速度较慢。我在这里错误地使用了 parMap 吗?这甚至是可以使用并行性的情况吗?

4

1 回答 1

2

我不认为你的测量是正确的。你parLife的确实比life. 事实上,在我的机器(Phenom X4,4 核)上,前者只需要后者大约 92.5% 的时间,考虑到你说你期望只有 6% 的改进,这是相当不错的。

您的基准测试设置是什么?你试过使用criterion吗?这是我所做的:

import Criterion
import Criterion.Main

-- your code, minus main

runGame f n = last $ take n $ iterate f fPent
    where fPent = [(1, 2), (2, 2), (2, 1), (2, 3), (3, 3)]

main = defaultMain
    [ bench "No parallelism 200" $ whnf (runGame life)    200
    , bench "Parallelism 200"    $ whnf (runGame parLife) 200 ]

编译ghc --make -O2 -o bench并运行./bench -o bencht.hmtl +RTS -N3.

这是报告的详细结果

于 2012-09-01T13:57:09.963 回答