问题标签 [aleagpu]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
43 浏览

aleagpu - 随机模块未按预期运行

当我连续运行随机模块时,它给了我相同的结果。有什么办法可以解决这个问题吗?Alea 上的文档在某些地方确实很少。

0 投票
1 回答
761 浏览

aleagpu - 如何让 Alea 更快?

在 Alea 中完成了一些实现各种 ML 算法的工作后,我尝试在 Alea 中对一些简单但必不可少的例程进行基准测试。令我惊讶的是,Alea' 比等效的 cuBLAS 调用 sgeam 执行相同操作所需的时间大约长 3 倍。如果我在做一些更复杂的事情,比如矩阵乘法,我不得不处理共享内存,这是可以理解的,但以下只是简单的数组转换。

DeviceUnaryTransformModule 转换模块的内核与基本转换示例中的相同,唯一的区别是之后它不会收集到主机,而是将数据保存在设备上。

此外,Unbound 的 reduce 对我来说真的很糟糕,事实上非常糟糕,以至于我一直在使用它的方式肯定有错误。它比使用 sgeamv 两次对矩阵求和大约慢 20 倍。

我没有尝试将它与 CUDA C++ 进行比较,但对于简单的事情,我认为它应该与 cuBLAS 相提并论。我以为优化标志可能已经关闭,但后来发现它默认是打开的。我在这里缺少任何优化提示吗?

0 投票
1 回答
55 浏览

aleagpu - 如何获取泛型类型的默认值(用于经纱随机播放)?

我想获得 'T 的默认值,但由于 Unchecked.defaultof<'T>,上面的代码片段给出了编译错误。在 Alea 中进行经纱洗牌的首选方式是什么?

现在,由于我有一个问题,即许多线程从同一位置读取一次,我正在尝试测试仅从该位置读取第一个线程然后将值随机分配给经线中的其他线程是否更有效。(编辑:一点也不。缓存做得很好。)

0 投票
1 回答
28 浏览

aleagpu - 如何在内核中获取设备架构?

正如标题所要求的那样。两个都

编译失败。

0 投票
1 回答
536 浏览

cuda - 在使用来自 Cuda Unbound 的 blockReduce 后,向所有线程广播值的有效方法是什么?

上面的代码片段计算了二维矩阵每一列的平均值。由于块中只有线程 0 具有完整值,因此我将其存储到共享内存中column_mean_shared,使用__syncthreads()然后将其广播到块中的所有线程,因为我需要它们具有该值才能计算方差。

是否有更好的方法来传播价值,或者上述方法是否已经足够有效?

0 投票
1 回答
29 浏览

aleagpu - Are Unbound's block and device radix sorts supported now?

Sort is not trivial to implement and I can't find the module in either documentation or the autocomplete. Is it not supported yet?

0 投票
1 回答
163 浏览

aleagpu - DeviceReduceModule 找不到 IL 文件

以上是相关的片段。我猜我没有正确设置 Alea,但麻烦的是其他一切对我来说都很完美。只有下面这段代码会引发异常。

我在 F# 脚本模式下完成所有工作,这就是我的设置方式。

我自己的代码,CuBlas,Unbound 的随机模块,Unbound 的块缩减和扫描,以及DeviceSumModuleF32为我工作。Alea.CUDA.Settings.Instance.Resource.AssemblyPath我尝试将and指向Alea.CUDA.Settings.Instance.Resource.Path各种库目录,但这似乎根本没有做任何事情。在过去的几周里根本没有设置它并没有妨碍我。我还没有接触过 app.config 文件,因为我不确定如何配置它,并且不习惯手动编辑配置文件。

有什么建议吗?

0 投票
1 回答
47 浏览

aleagpu - DeviceReduceModule 抛出一个溢出异常

我尝试了各种 maxNumItems 设置,但无论它抛出什么异常。与上次不同,我什至不知道错误可能是什么,所以我在这里包含了整个转储。

0 投票
1 回答
97 浏览

aleagpu - 使用 Alea 查找内存泄漏

我有一些脚本在运行一段时间后会引发 Cuda 内存不足异常。在它们内部,我使用的是预先分配的数组,所以我没想到这是个问题。尽管如此,在我将脚本转换为 .fs 文件并对其进行编译后,分析器对于此任务并不是特别有用,并且 cuda-memcheck 工具 6.5 (36) 在我使用它时抛出了 CudaInterOp 异常。cuda-memcheck 7.0 (40) 实际上迫使我在 GPU 熄灭时重置 PC。

我现在有点不确定该怎么做。如何使用 Alea 修复泄漏?

0 投票
1 回答
161 浏览

c - 我们如何使用 AleaGpu 将多维数组复制到内核中?

我们如何将多维数组复制到 AleaGPU 的内核中?我们如何在内核中使用多维数组进行开发?

Malloc似乎不接受?