问题标签 [chainer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
neural-network - 神经网络无法预测高值。
我正在尝试设计一个用于预测回归值的前馈神经网络。相关值的训练集中最大值为 125,最小值为 -1000。
但是在训练我的神经网络后,预测最大值为 9 ,最小值为 -7 。
谁能建议我如何改进预测。
batch-normalization - 加载预训练参数然后评估验证数据集时如何使用chainer.links.BatchNormalization
我使用预训练的 imagenet 模型来使用 ResNet101 和 BN 层来训练另一个数据集。
训练结束后,我应该如何评估模型?我不应该设置chainer.using_config('train', False)
吗?
我发现即使我在训练数据集上评估(仅达到 80%)而不是验证数据集,评估的准确性也太低了。但是当我切换到 时chainer.using_config('train', True)
,准确率可以达到 99%。
我也在https://github.com/chainer/chainer/issues/4553上提出了这个问题
审稿人评论之一:
我认为问题是由于 BatchNorm 使用不同的统计数据进行训练和测试。
我的回答是基于您在新数据集(包括训练/验证/测试集)上应用预训练模型的假设。也许我错了
具体来说,如果您使用预训练模型,那么原始数据集(可能是 ImageNet)中批次的统计信息会被重用。因此,在训练期间,统计数据(均值、标准差)实际上是先前数据集和当前训练拆分的组合。然后,如果您再次使用 chainer.using_config('train', False) 评估训练拆分,则统计信息将被重置,因此纯粹来自训练拆分。正如我之前遇到的那样,这些差异可能会导致性能下降。
无论如何,我认为重要的是要考虑使用哪些数据来计算 BatchNorm 的统计数据的运行平均值,因为即使使用相同的数据,这也会对评估产生很大的影响。
chainer - Chainer:询问模型形状
是否可以检查 chainer.Chain 以检索它期望的输入数组的形状?我想这样做是为了在推理之前重塑 numpy 数组。
谢谢!
python - Chainer:无法分类,训练好的模型(x)抛出错误
我正在使用 Chainer 进行书面数字识别。我已经在 MNIST 数据库上训练了一个模型。但是,由于某种原因,我无法对单个示例进行分类。我的猜测是我没有为示例选择正确的格式,但我已经尝试了很多方法,但我仍然无法解决这个问题。如果这很明显,我很抱歉,我对 Python 没有经验。
代码:
python - 元组索引超出范围(Python + Chainer)
我是新手,也是编码的初学者。目前,我正计划自己编写一个自动编码器来减少功能。虽然我大部分时间都在通过查看网站和书籍来解决我遇到的错误,但我仍然在调试。
dtypes 是 float64(5),行和列是 (37310, 5)。
任何评论都应该有帮助。先感谢您!!
chainer - Cupy错误安装
我尝试通过 pip install cupy 安装 cupy。我收到以下错误:
我在 SSH linux 服务器上工作。我对linux环境不满意。我的问题看起来环境不好,请问如何正确设置它们?我想用cupy和cainer
lda - Adam' 对象没有属性 'zero_grads'
我使用不是我写的代码。因此,在执行此代码时,我们会收到有关 zero_grads() 不存在的错误
这段代码是:
我应该改变吗:optimizer.zero_grads()
到
请注意,我使用的是chainer 4.0 版本和使用chainer 1.5 构建的代码。
chainer - Chainer:ParallelUpdater 性能与 MultiprocessUpdater
我想在 CIFAR10 数据集上训练一个 CNN,并在单个节点上的多个 GPU 上使用 chainer。我尝试调整此示例以使用 ParallelUpdater,其方式与mnist 数据并行示例相同,但训练性能非常差 - 比在一个 GPU 上训练慢,即使所有 8 个 GPU 都在使用。我更改为 MultiprocessUpdater,性能(迭代次数/秒)要好得多。
坏的:
好的:
我还使用 ParallelUpdater 使用 8 个 GPU 运行了这个基准测试脚本,但性能也很差:https ://github.com/mitmul/chainer-cifar10/blob/master/train.py
我的问题是:我怎样才能从 ParallelUpdater 获得良好的性能,我可能做错了什么?
谢谢!
chainer - 如何在chainer中使用BatchNormalization3D?
chainer.links.BatchNormalization 只能支持 2D 特征图吗?如何在chainer中编写BatchNormalization3D代码?
此外,pytorch 已经在此处支持 BN3D: https ://pytorch.org/docs/master/nn.html?highlight=batchnorm3d#torch.nn.BatchNorm3d 它是 5D 输入(带有附加通道的小批量 3D 输入方面)