似乎x[indices]
返回的是副本而不是视图。
>>> import pyopencl as cl
>>> import numpy as np
>>> from pyopencl import array
>>> from pyopencl import clrandom
>>>
>>> ctx = cl.create_some_context()
>>> queue = cl.CommandQueue(ctx,
... properties=cl.command_queue_properties.PROFILING_ENABLE)
>>>
>>> x=array.zeros(queue, 512, dtype=np.float32 )
>>>
>>> indices = clrandom.rand(queue, 17 , dtype=np.int32 ,luxury=2, a=1 , b=512)
>>> x_cp = x[indices]
>>> x_cp
array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0.], dtype=float32)
>>> clrandom.RanluxGenerator(queue,luxury=0).fill_normal(x_cp, mu=0, sigma=1)
>>> x_cp
array([ 1.16633689, 0.65845662, 1.97530341, -0.53728914, 1.38982224,
1.47071588, -0.73042828, 1.29367638, 1.2390343 , 2.89497447,
-0.75589401, 0.04600764, -4.28992653, 0.50232059, 0.4881362 ,
0.01112503, -0.46737072], dtype=float32)
>>> x[indices]
array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
0., 0., 0., 0.], dtype=float32)
您可以尝试以下方法:
- 创建一个与您的数组具有相同尺寸的 float32 数组
indices
,让我们调用它tmp_random
。
- 生成随机数并将它们存储在
tmp_random
- 编写一个以
indices
、tmp_random
和x
作为参数的内核。每个线程从 中读取一个索引indices
和相应的随机数,tmp_random
并将其存储在x
.