2

我一直在测试 CuPy 库并使用 einsum 做了一个简单的矩阵乘法:

C = cp.einsum('pqrs,rs->pq', A, B)

A 和 B 的尺寸分别为 (41, 41, 41, 41) (41, 41)。我还检查了它们的大小,分别是 22606088 字节、13448 字节。

While running the code, I am getting the following error message:
OutOfMemoryError: out of memory to allocate 38000834048 bytes (total 38023468032 bytes)

这表明我的内存不足。是否有任何选项可以将部分数据发送到设备并批量执行操作?

4

1 回答 1

0

我认为没有选项可以为一个数组部分发送数据。

我之前也遇到过同样的问题,这可能是因为cupy einsum效率还没有优化造成的。 https://github.com/cupy/cupy/issues/19#issuecomment-322972682

如果您可以尝试使用transpose,reshape等替换您的 einsum 函数matmul,请尝试这些。

我猜

C = cp.einsum('pqrs,rs->pq', A, B)

相当于

p, q, r, s = A.shape
A = cp.reshape(A, (p, q, r*s))
B = cp.reshape(B, (1, 1, r*s))
C = cp.sum(A * B, axis=2)
于 2018-11-16T02:58:57.700 回答