1

我只是想创建一个随机矩阵 A,其向量来自 Dirichlet 分布。该功能适用​​于numpy

import numpy as np
A = np.random.dirichlet(np.ones(n), n)

当我对cupy做同样的事情时

import cupy as cp
A = cp.random.dirichlet(cp.ones(n), n)

我收到以下错误:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-1-45a4f64a8b6e> in <module>
      6 n = 10000 #Size of the square matrix
      7 
----> 8 A = cp.random.dirichlet(cp.ones(n), n)
      9 
     10 print("--- %s seconds ---" % (time.time() - start_time))

~\anaconda3\envs\tensorflow\lib\site-packages\cupy\random\_distributions.py in dirichlet(alpha, size, dtype)
    112     """
    113     rs = _generator.get_random_state()
--> 114     return rs.dirichlet(alpha, size, dtype)
    115 
    116 

~\anaconda3\envs\tensorflow\lib\site-packages\cupy\random\_generator.py in dirichlet(self, alpha, size, dtype)
    144             size = alpha.shape
    145         else:
--> 146             size += alpha.shape
    147         y = cupy.empty(shape=size, dtype=dtype)
    148         _kernels.standard_gamma_kernel(alpha, self._rk_seed, y)

TypeError: unsupported operand type(s) for +=: 'int' and 'tuple'

当输入是这样的numpy数组时

import cupy as cp
import numpy as np

A = cp.random.dirichlet(np.ones(n), n)

然后我得到同样的错误。

alpha.shape我手动检查时,第 146 行是 (n,)。它是一个cupy bug还是我错过了什么?

我正在为 CUDA 10.1 使用 cupy-cuda101 版本 8.5.0。与 cupy 和 tensorflow 有关的所有其他内容都可以在我的 GPU (2080ti) 上完美运行。

4

1 回答 1

1

这是 cupy 中的一个错误,您应该在他们的 GitHub 上报告。

尽管有文档,但它们没有正确处理整数参数的情况。他们要求您提供一个元组或None. 这就是为什么你看到你所看到的行为。(如果您提供了一个 tuple (a, b),那么生成的形状应该是(a, b, n).

这里的解决方法是提供您想要的形状作为长度为 1 的元组:(n,)。请注意,逗号是必需的。

于 2021-02-28T03:14:05.437 回答