问题标签 [chainer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
chainer - 尝试使用带有 Chainer 的 Resnet50 预测单个图像时,我收到警告“A batch with no more than one sample ---”
尝试预测单个图像时,我收到警告“已将不超过一个样本的批次提供给 F.batch_normalization。F.batch_normalization 将始终为此类批次输出零张量”。
我正在使用带有 Chainer 的 Resnet50 模型(二进制分类输出),在训练时,训练集和测试集的准确率均 > 98%。但是当我试图预测单个图像时,准确率只有 50% 左右。
我想我必须批量预测图像(因为批量标准化)以避免警告并获得高精度,对吧?是否可以预测单个图像?
P/s:我在预测脚本中尝试了 chainer.using_config('train', False) 但它没有帮助。
chainer - 将 pretrain caffe 模型导入到 chainer 时出现错误解析消息
我想将 Resnet50 预训练文件“ResNet-50-model.caffemodel”导入到chainer。这是链接器代码:
但我收到如下错误消息:
我不知道为什么会发生这个错误,它应该可以工作,请帮助我。谢谢你们。
chainer - 哪些问题会导致 ConvolutionND 出现 CuDNNError
我在我的链中使用三维卷积链接(带有 ConvolutionND)。
前向计算运行顺利(我检查了中间结果形状以确保我正确理解了 convolution_nd 参数的含义),但在后向计算过程中,aCuDNNError
会随着 message 升高CUDNN_STATUS_NOT_SUPPORTED
。
ConvolutionND的cover_all
参数作为其默认值 False,所以从文档中我看不出错误的原因是什么。
这是我定义卷积层之一的方法:
调用堆栈是
那么在使用的时候有没有特别要注意的地方ConvolutionND
呢?
例如,失败的代码是:
python - Chainer - 使用 GPU 进行预测
我有一个训练有素的 Chainer 模型,我想用它来执行预测。默认情况下,我可以在 CPU 上预测图像,但我想使用 GPU,我不知道该怎么做。这是我的代码的样子:
这在 CPU 上运行良好。我应该添加什么来预测 GPU ?我试过了:
model.to_gpu(0)
chainer.cuda.get_device_from_id(0).use()
- 将图像转换为 CuPy 数组
image = cupy.array(image)
使用所有这些选项,我得到一个错误:
我在这里做错了什么?如何在 GPU 上执行预测?提前感谢您的帮助。
tensorflow - 用cupy求解矩形稀疏线性方程组
我正在尝试使用cupy解决稀疏特征的矩形系统。我知道内置函数sparse.linalg.lsqr(A, b)
是为 square matrix 做的A
。但是我喜欢解决一个矩形稀疏系统。这是我们可以解决平方系统的方法:
它给出了矩形系统的尺寸不匹配错误,我找不到与 eg 等效的内置稀疏方法cupy.tensorsolve()
。
顺便说一句,有没有办法用 Tensorflow 做到这一点?谢谢你的帮助。我正在使用谷歌 Colaboratory 笔记本。
python-2.7 - Chainer 的链接变为“NoneType”
我正在尝试使用 Chainer (v4.0.0b1) 构建具有多 GPU 的 LSTM 网络。如以下代码所示。
但是,LSTM 链接变为“NoneType”。如以下调用错误。
我觉得这很奇怪,所以我显示了“self.lstm”。结果,显示“无”。例如,“Link”的 fc1 显示如下。
我发现“self.lstm = L.LSTM(1000, 1000).to_gpu(1)”中的“self.lstm”不能声明为链接。但是,我不知道为什么我不能声明它。
我使用Chainer 的 Docker作为执行环境。
谢谢你的回答。
tensorflow - 来自英语单词嵌入的非英语单词嵌入
如何从英语词嵌入生成非英语(法语、西班牙语、意大利语)词嵌入?
为非英语单词生成高质量词嵌入的最佳方法是什么?
单词可能包括 (samsung-galaxy-s9)
python - How to apply Optimizer on Variable in Chainer?
Here is an example in Pytorch:
And here in Tensorflow:
But Chainer's optimizers only can use on 'Link', how can I apply Optimizer on Variable in Chainer?
python - 每个时期的数据大小都不同
我编写了一个程序,使用“Chainer”来训练我的模型,数据来自另一个我使用 Python 的函数yield
。我观察到的是每个时期数据变化的大小。
有人可以向我解释输入数据大小变化的原因吗?
有什么办法可以避免这种情况吗?
python - Chainer 中加载的神经网络层的梯度
我在 Chainer 中加载一个预训练模型:
然后,我用一些数据进行前向传递并添加一个损失层:
acts = net.predict([image]).array
loss=chainer.Variable(np.array(np.sum(np.square(acts-one_hot))))
现在的问题是,我怎样才能进行反向传递并获得不同层的渐变?
典型的向后方法不起作用。