4

我正在尝试使用加速器 v2 在 F# 中编写生活,但由于某些奇怪的原因,尽管我的所有数组都是方形的,但我的输出不是方形 - 似乎除了矩阵左上角的矩形区域之外的所有内容都被设置为错误的。我不知道这是怎么发生的,因为我的所有操作都应该平等地对待整个数组。有任何想法吗?

open Microsoft.ParallelArrays
open System.Windows.Forms
open System.Drawing
type IPA = IntParallelArray
type BPA = BoolParallelArray
type PAops = ParallelArrays
let RNG = new System.Random()
let size = 1024
let arrinit i = Array2D.init size size (fun x y -> i)
let target = new DX9Target()
let threearr = new IPA(arrinit 3)
let twoarr =   new IPA(arrinit 2)
let onearr =   new IPA(arrinit 1)
let zeroarr =  new IPA(arrinit 0)
let shifts = [|-1;-1|]::[|-1;0|]::[|-1;1|]::[|0;-1|]::[|0;1|]::[|1;-1|]::[|1;0|]::[|1;1|]::[]
let progress (arr:BPA) = let sums = shifts //adds up whether a neighbor is on or not
                                    |> List.fold (fun (state:IPA) t ->PAops.Add(PAops.Cond(PAops.Rotate(arr,t),onearr,zeroarr),state)) zeroarr
                         PAops.Or(PAops.CompareEqual(sums,threearr),PAops.And(PAops.CompareEqual(sums,twoarr),arr)) //rule for life
let initrandom () = Array2D.init size size (fun x y -> if RNG.NextDouble() > 0.5 then true else false)

type meform () as self= 
    inherit Form()
    let mutable array = new BoolParallelArray(initrandom())
    let timer = new System.Timers.Timer(1.0) //redrawing timer
    do base.DoubleBuffered <- true
    do base.Size <- Size(size,size)
    do timer.Elapsed.Add(fun _ -> self.Invalidate())
    do timer.Start()
    let draw (t:Graphics) = 
        array <- array |> progress
        let bmap = new System.Drawing.Bitmap(size,size)
        target.ToArray2D array
        |> Array2D.iteri (fun x y t ->
                 if not t then bmap.SetPixel(x,y,Color.Black))
        t.DrawImageUnscaled(bmap,0,0)

    do self.Paint.Add(fun t -> draw t.Graphics)

do Application.Run(new meform())
4

2 回答 2

6

正如 Robert 提到的,我写了一篇文章,展示了如何使用 Accelerator v2在 F# 中实现 Game of Life,因此您可以查看它的工作版本。我记得有类似的问题,但我不知道具体是什么情况。

无论如何,如果您正在使用,DX9Target那么问题可能是这个目标不应该支持整数运算(因为使用 DX9 在 GPU 上精确地模拟整数运算是不可能的)。FloatParallelArray我相信这也是我最终在我的实现中使用的一个原因。你有没有机会试试看X64MulticoreTarget是否可行?

编辑:我做了一些进一步的调查,并且(除非我遗漏了一些重要的东西)它似乎是该CompareEqual方法的一个错误。这是一个更简单的示例来说明问题:

open Microsoft.ParallelArrays 

let target = new DX9Target() 
let zeros = new IntParallelArray(Array2D.create 4 4 0) 
let trues = target.ToArray2D(ParallelArrays.CompareEqual(zeros, zeros))

trues |> Array2D.iter (printfn "%A")

预期的结果是true(几次),但如果你运行它,它只打印true4 次,然后打印 12 次false。我会问 Accelerator 团队的某个人并在此处发布答案。同时,您可以做与我在示例中所做的相同的事情 - 即使用FPA和避免使用BPA和模拟布尔运算CompareEqual

编辑 2:这是 Accelerator 团队成员的回复:

这与 DX9 GPU 上缺乏精确的整数计算有关。由于数值抖动,整数与其自身的布尔比较并不总是被计算为完全相等。(...)

因此,总而言之,您不能真正依赖BPA. 唯一的选择是按照我的建议进行 - 使用模拟布尔值FPA(并可能将数字与一些小的 delta-neighborhood 进行比较,以避免由 GPU 引起的抖动)。但是,这应该与X86MulticoreTarget- 如果您能找到一些最小的重现来显示库在哪些情况下崩溃,那将非常有用!

于 2010-03-22T11:35:55.227 回答
2

关于精度问题:DX9 级 GPU 没有专用的整数硬件,因此整数流被解释为浮点流(您遇到的精度不足)。

DX10 级 GPU 现在支持所有 C 位运算的精确 32 位整数。但这并不一定意味着它们具有真正的 32 位整数 ALU。例如,在当前的 DX10 NVIDIA gen 整数数学是使用 24 位整数单元完成的,因此模拟了 32 位整数运算。下一代 DX11 NVIDIA 将带来真正的 32 位整数单元。

于 2010-03-25T13:45:24.203 回答