问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
289 浏览

chainer - 尝试使用带有 Chainer 的 Resnet50 预测单个图像时,我收到警告“A batch with no more than one sample ---”

尝试预测单个图像时,我收到警告“已将不超过一个样本的批次提供给 F.batch_normalization。F.batch_normalization 将始终为此类批次输出零张量”。

我正在使用带有 Chainer 的 Resnet50 模型(二进制分类输出),在训练时,训练集和测试集的准确率均 > 98%。但是当我试图预测单个图像时,准确率只有 50% 左右。

我想我必须批量预测图像(因为批量标准化)以避免警告并获得高精度,对吧?是否可以预测单个图像?

P/s:我在预测脚本中尝试了 chainer.using_config('train', False) 但它没有帮助。

0 投票
1 回答
191 浏览

chainer - 将 pretrain caffe 模型导入到 chainer 时出现错误解析消息

我想将 Resnet50 预训练文件“ResNet-50-model.caffemodel”导入到chainer。这是链接器代码:

但我收到如下错误消息:

我不知道为什么会发生这个错误,它应该可以工作,请帮助我。谢谢你们。

0 投票
1 回答
330 浏览

chainer - 哪些问题会导致 ConvolutionND 出现 CuDNNError

我在我的链中使用三维卷积链接(带有 ConvolutionND)。

前向计算运行顺利(我检查了中间结果形状以确保我正确理解了 convolution_nd 参数的含义),但在后向计算过程中,aCuDNNError会随着 message 升高CUDNN_STATUS_NOT_SUPPORTED

ConvolutionND的cover_all参数作为其默认值 False,所以从文档中我看不出错误的原因是什么。

这是我定义卷积层之一的方法:

调用堆栈是

那么在使用的时候有没有特别要注意的地方ConvolutionND呢?

例如,失败的代码是:

0 投票
1 回答
347 浏览

python - Chainer - 使用 GPU 进行预测

我有一个训练有素的 Chainer 模型,我想用它来执行预测。默认情况下,我可以在 CPU 上预测图像,但我想使用 GPU,我不知道该怎么做。这是我的代码的样子:

这在 CPU 上运行良好。我应该添加什么来预测 GPU ?我试过了:

  • model.to_gpu(0)
  • chainer.cuda.get_device_from_id(0).use()
  • 将图像转换为 CuPy 数组image = cupy.array(image)

使用所有这些选项,我得到一个错误:

我在这里做错了什么?如何在 GPU 上执行预测?提前感谢您的帮助。

0 投票
2 回答
366 浏览

tensorflow - 用cupy求解矩形稀疏线性方程组

我正在尝试使用cupy解决稀疏特征的矩形系统。我知道内置函数sparse.linalg.lsqr(A, b)是为 square matrix 做的A。但是我喜欢解决一个矩形稀疏系统。这是我们可以解决平方系统的方法:

它给出了矩形系统的尺寸不匹配错误,我找不到与 eg 等效的内置稀疏方法cupy.tensorsolve()

顺便说一句,有没有办法用 Tensorflow 做到这一点?谢谢你的帮助。我正在使用谷歌 Colaboratory 笔记本。

0 投票
2 回答
73 浏览

python-2.7 - Chainer 的链接变为“NoneType”

我正在尝试使用 Chainer (v4.0.0b1) 构建具有多 GPU 的 LSTM 网络。如以下代码所示。

但是,LSTM 链接变为“NoneType”。如以下调用错误。

我觉得这很奇怪,所以我显示了“self.lstm”。结果,显示“无”。例如,“Link”的 fc1 显示如下。

我发现“self.lstm = L.LSTM(1000, 1000).to_gpu(1)”中的“self.lstm”不能声明为链接。但是,我不知道为什么我不能声明它。

我使用Chainer 的 Docker作为执行环境。

谢谢你的回答。

0 投票
2 回答
234 浏览

tensorflow - 来自英语单词嵌入的非英语单词嵌入

如何从英语词嵌入生成非英语(法语、西班牙语、意大利语)词嵌入?

为非英语单词生成高质量词嵌入的最佳方法是什么?

单词可能包括 (samsung-galaxy-s9)

0 投票
2 回答
248 浏览

python - How to apply Optimizer on Variable in Chainer?

Here is an example in Pytorch:

And here in Tensorflow:

But Chainer's optimizers only can use on 'Link', how can I apply Optimizer on Variable in Chainer?

0 投票
1 回答
66 浏览

python - 每个时期的数据大小都不同

我编写了一个程序,使用“Chainer”来训练我的模型,数据来自另一个我使用 Python 的函数yield。我观察到的是每个时期数据变化的大小。

有人可以向我解释输入数据大小变化的原因吗?

有什么办法可以避免这种情况吗?

0 投票
2 回答
268 浏览

python - Chainer 中加载的神经网络层的梯度

我在 Chainer 中加载一个预训练模型:

然后,我用一些数据进行前向传递并添加一个损失层:

acts = net.predict([image]).array loss=chainer.Variable(np.array(np.sum(np.square(acts-one_hot))))

现在的问题是,我怎样才能进行反向传递并获得不同层的渐变?

典型的向后方法不起作用。