4

作为一个更大问题的一部分,我试图在数组中定义一个数组,如下所示:

import Data.Array.Repa
type Arr = Array DIM2 Int

arr = force $ fromList (Z :. 5 :. 5) [1..25] :: Arr

combined :: Arr
combined = arr `deepSeqArray` 
    traverse arr (\_ -> Z :. 4 :. 4 :: DIM2) (\f (Z :. x :. y) -> 
        let reg = force $ extract f (x,y) (2,2)
        in  reg `deepSeqArray` sumAll reg)

extract :: (DIM2 -> Int) -> (Int,Int) -> (Int,Int) -> Arr
extract lookup (x0,y0) (width,height) = fromFunction bounds 
  $ \sh -> offset lookup sh
    where 
    bounds = Z :. width :. height
    offset :: (DIM2 -> Int) -> DIM2 -> Int
    offset f (Z :. x :. y) = f (Z :. x + x0 :. y + y0)

main = print combined

extract函数正在使用fromFunction并为其提供了查找函数,但它也可以使用traverseandarr ! ...来达到相同的效果。尽管尽可能早地在任何地方使用forceand ,但控制台在这里填充了消息,然后是正确的结果:deepSeqArray

Data.Array.Repa:按顺序执行嵌套并行计算。您可能在另一个实例已经在运行时调用了“强制”函数。如果第二个版本由于延迟评估而暂停,则可能会发生这种情况。使用“deepSeqArray”确保在“强制”下一个数组之前对每个数组进行全面评估。

虽然我还没有构建一个带有列表来比较速度的版本,但在更大的版本中,性能受到了影响。

这仅仅是嵌套数组定义的结果吗,因此我应该重组我的程序以使内部或外部定义成为列表?我的extract功能是否可怕以及问题的原因?

这个问题的提示对于做到这一点很有用,但我还没有浏览编译的代码。

4

1 回答 1

2

这是因为“打印”也隐含地强制数组。内部的“force”和“sumAll”函数调用并行计算,但执行“print”,所以你有嵌套的并行性。事实如此不明显,这在 Repa 2 API 中是一个很大的遗憾。

Repa 3 通过导出 'force' 和 'sumAll' 等的顺序和并行版本来解决这些问题。它还向数组类型添加了一个标签,以指示数组是延迟还是清单。Repa 3 尚未完成,但您可以使用http://code.ouroborus.net/repa上的 head 版本。在今年晚些时候的 GHC 7.4 之后应该很快就会出现。

这是您的示例的 Repa 3 版本,它在运行时不会发出有关嵌套并行性的警告。请注意,“力”现在是“计算”。

import Data.Array.Repa

arr :: Array U DIM2 Int
arr = fromListUnboxed (Z :. 5 :. 5) [1..25]

combined :: Array U DIM2 Int
combined 
  = computeP $ traverse arr (\_ -> Z :. 4 :. 4 :: DIM2) 
  $ \f (Z :. x :. y) -> sumAllS $ extract f (x,y) (2,2)

extract :: (DIM2 -> Int) -> (Int,Int) -> (Int,Int) -> Array D DIM2 Int
extract lookup (x0,y0) (width,height) 
  = fromFunction bounds 
  $ \sh -> offset lookup sh
    where 
    bounds = Z :. width :. height
    offset :: (DIM2 -> Int) -> DIM2 -> Int
    offset f (Z :. x :. y) = f (Z :. x + x0 :. y + y0)

main = print combined
于 2011-11-23T03:30:13.310 回答