作为一个更大问题的一部分,我试图在数组中定义一个数组,如下所示:
import Data.Array.Repa
type Arr = Array DIM2 Int
arr = force $ fromList (Z :. 5 :. 5) [1..25] :: Arr
combined :: Arr
combined = arr `deepSeqArray`
traverse arr (\_ -> Z :. 4 :. 4 :: DIM2) (\f (Z :. x :. y) ->
let reg = force $ extract f (x,y) (2,2)
in reg `deepSeqArray` sumAll reg)
extract :: (DIM2 -> Int) -> (Int,Int) -> (Int,Int) -> Arr
extract lookup (x0,y0) (width,height) = fromFunction bounds
$ \sh -> offset lookup sh
where
bounds = Z :. width :. height
offset :: (DIM2 -> Int) -> DIM2 -> Int
offset f (Z :. x :. y) = f (Z :. x + x0 :. y + y0)
main = print combined
该extract
函数正在使用fromFunction
并为其提供了查找函数,但它也可以使用traverse
andarr ! ...
来达到相同的效果。尽管尽可能早地在任何地方使用force
and ,但控制台在这里填充了消息,然后是正确的结果:deepSeqArray
Data.Array.Repa:按顺序执行嵌套并行计算。您可能在另一个实例已经在运行时调用了“强制”函数。如果第二个版本由于延迟评估而暂停,则可能会发生这种情况。使用“deepSeqArray”确保在“强制”下一个数组之前对每个数组进行全面评估。
虽然我还没有构建一个带有列表来比较速度的版本,但在更大的版本中,性能受到了影响。
这仅仅是嵌套数组定义的结果吗,因此我应该重组我的程序以使内部或外部定义成为列表?我的extract
功能是否可怕以及问题的原因?
这个问题的提示对于做到这一点很有用,但我还没有浏览编译的代码。