我在使用 Keras 为具有大 3D 张量的语言模型训练 RNN 时收到此消息(从文本生成,一个热编码,结果形状为 (165717, 25, 7631)):
WARNING (theano.configdefaults): g++ not detected ! Theano will be unable to
execute optimized C-implementations (for both CPU and GPU) and will default to
Python implementations. Performance will be severely degraded. To remove this
warning, set Theano flags cxx to an empty string.
ERROR (theano.sandbox.cuda): nvcc compiler not found on $PATH. Check your nvcc
installation and try again.
但是一切都很顺利,而我将数据集的大小限制在很小的范围内。因此,我想知道 Theano 或 CUDA 是否限制了矩阵的大小?
此外,我有没有更好的方法来做一个热门的表示?我的意思是,在大型 3D 张量中,由于 one-hot 表示,大多数元素都是 0。但是,我没有找到接受单词索引表示的层。