问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
97 浏览

neural-network - 神经网络无法预测高值。

我正在尝试设计一个用于预测回归值的前馈神经网络。相关值的训练集中最大值为 125,最小值为 -1000。

但是在训练我的神经网络后,预测最大值为 9 ,最小值为 -7 。

谁能建议我如何改进预测。

0 投票
1 回答
303 浏览

batch-normalization - 加载预训练参数然后评估验证数据集时如何使用chainer.links.BatchNormalization

我使用预训练的 imagenet 模型来使用 ResNet101 和 BN 层来训练另一个数据集。

训练结束后,我应该如何评估模型?我不应该设置chainer.using_config('train', False)吗?

我发现即使我在训练数据集上评估(仅达到 80%)而不是验证数据集,评估的准确性也太低了。但是当我切换到 时chainer.using_config('train', True),准确率可以达到 99%。

我也在https://github.com/chainer/chainer/issues/4553上提出了这个问题

审稿人评论之一:

我认为问题是由于 BatchNorm 使用不同的统计数据进行训练和测试。

我的回答是基于您在新数据集(包括训练/验证/测试集)上应用预训练模型的假设。也许我错了

具体来说,如果您使用预训练模型,那么原始数据集(可能是 ImageNet)中批次的统计信息会被重用。因此,在训练期间,统计数据(均值、标准差)实际上是先前数据集和当前训练拆分的组合。然后,如果您再次使用 chainer.using_config('train', False) 评估训练拆分,则统计信息将被重置,因此纯粹来自训练拆分。正如我之前遇到的那样,这些差异可能会导致性能下降。

无论如何,我认为重要的是要考虑使用哪些数据来计算 BatchNorm 的统计数据的运行平均值,因为即使使用相同的数据,这也会对评估产生很大的影响。

0 投票
0 回答
57 浏览

chainer - Chainer:询问模型形状

是否可以检查 chainer.Chain 以检索它期望的输入数组的形状?我想这样做是为了在推理之前重塑 numpy 数组。

谢谢!

0 投票
1 回答
77 浏览

python - Chainer:无法分类,训练好的模型(x)抛出错误

我正在使用 Chainer 进行书面数字识别。我已经在 MNIST 数据库上训练了一个模型。但是,由于某种原因,我无法对单个示例进行分类。我的猜测是我没有为示例选择正确的格式,但我已经尝试了很多方法,但我仍然无法解决这个问题。如果这很明显,我很抱歉,我对 Python 没有经验。

这就是错误的样子

代码:

0 投票
1 回答
460 浏览

python - 元组索引超出范围(Python + Chainer)

我是新手,也是编码的初学者。目前,我正计划自己编写一个自动编码器来减少功能。虽然我大部分时间都在通过查看网站和书籍来解决我遇到的错误,但我仍然在调试。

dtypes 是 float64(5),行和列是 (37310, 5)。

任何评论都应该有帮助。先感谢您!!

0 投票
1 回答
3531 浏览

chainer - Cupy错误安装

我尝试通过 pip install cupy 安装 cupy。我收到以下错误:

我在 SSH linux 服务器上工作。我对linux环境不满意。我的问题看起来环境不好,请问如何正确设置它们?我想用cupy和cainer

0 投票
1 回答
2577 浏览

lda - Adam' 对象没有属性 'zero_grads'

我使用不是我写的代码。因此,在执行此代码时,我们会收到有关 zero_grads() 不存在的错误

这段代码是:

我应该改变吗:optimizer.zero_grads()

请注意,我使用的是chainer 4.0 版本和使用chainer 1.5 构建的代码。

0 投票
2 回答
409 浏览

chainer - Chainer:ParallelUpdater 性能与 MultiprocessUpdater

我想在 CIFAR10 数据集上训练一个 CNN,并在单个节点上的多个 GPU 上使用 chainer。我尝试调整此示例以使用 ParallelUpdater,其方式与mnist 数据并行示例相同,但训练性能非常差 - 比在一个 GPU 上训练慢,即使所有 8 个 GPU 都在使用。我更改为 MultiprocessUpdater,性能(迭代次数/秒)要好得多。

坏的:

好的:

我还使用 ParallelUpdater 使用 8 个 GPU 运行了这个基准测试脚本,但性能也很差:https ://github.com/mitmul/chainer-cifar10/blob/master/train.py

我的问题是:我怎样才能从 ParallelUpdater 获得良好的性能,我可能做错了什么?

谢谢!

0 投票
1 回答
50 浏览

python - 多进程迭代器不起作用

我正在使用来自chainer的MultiprocessIterator来训练NN。代码在这里

结果是:

系统信息:

似乎MultiprocessIterator不起作用。有人有线索吗?先感谢您。

0 投票
1 回答
65 浏览

chainer - 如何在chainer中使用BatchNormalization3D?

chainer.links.BatchNormalization 只能支持 2D 特征图吗?如何在chainer中编写BatchNormalization3D代码?

此外,pytorch 已经在此处支持 BN3D: https ://pytorch.org/docs/master/nn.html?highlight=batchnorm3d#torch.nn.BatchNorm3d 它是 5D 输入(带有附加通道的小批量 3D 输入方面)