问题标签 [chainer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
chainer - 如何在chainer v2.0中修复学习网络中的层参数?
假设我已经在其他数据库上预训练了网络。因为过拟合问题,我的数据库不是很多样化,所以过拟合问题很严重。我想在chainer v2.0中加载预训练的网络参数,但要修复前几层,在这种情况下,我应该在chainer v2.0中使用什么,我知道在chainer1.0中有volatile关键字,但在v2中已弃用.0.
在前几层处理时我应该使用with chainer.no_backprop_mode():
inside吗?def __call__
chainer - 如何在chainer v2.1.0中使用mix link Multi-CPU的并行计算
在我的研究中。我在神经网络中写了2层,最底层的第一层是运行在GPU上的RNN,最上面的第二层是CPU(算法模型性质更适合CPU),我在chainer自定义Link中在CPU中实现。
但是,CPU 层很慢,我等不及我的论文提交的截止日期。所以我想使用这一层的并行计算。
实现并行此链接的最佳实践和快速方法是什么?
python - NStepLSTM 和 Seq2Seq 模型
亲爱的chainer社区,
我无法抗拒官方示例NStepLSTM
中的逻辑用法(英文到法文翻译)。seq2seq
def __call__(self, xs, ys): xs = [x[::-1] for x in xs] #Reverse x
据我所知xs
,这是一个英文短语,ys
也是一个法语短语。你为什么把英文短语倒过来?你如何训练网络?您将
xs
和嵌入ys
到连续空间中,然后向编码器输入,exs
以获得英语短语的潜在表示。但是然后你将潜在表示放入解码器中eys
。但是eys
是法语短语的连续表示,在测试阶段解码器无法知道生成的法语短语,可以吗?你如何应用你的网络?hx, cx, _ = self.the encoder(None, None, exs) _, _, os = self.decoder(hx, cx, eys)
ys_in = [F.concat([eos, y], axis=0) for y in ys]
为什么我们把它放在end of sequence
开头?ys = self.xp.full(batch, EOS, 'i')
中def translate
,我们将数组放入end of sequence
解码器,为什么?
如果我不想翻译句子而是构建一个自动编码器来将短语映射到潜在空间,我该怎么办?
python - Chainer 库的 `__init__.py` 文件中的“#NOQA”是什么意思?
我正在阅读 Chainer 源代码并注意到https://github.com/chainer/chainer/blob/master/chainer/init .py #L7
是什么#NOQA
意思?
谢谢
chainer - 如何用chainer做外层产品?
如何将外部产品(先前的特征向量及其本身)包含在链接器中作为层,尤其是以与批处理兼容的方式?
python - 使用 cupy 进行异步 GPU 内存传输
cupy
是否可以使用(或)从/向 GPU 异步传输内存chainer
?
我正在训练一个相对较小的网络,其中包含不适合 GPU 内存的大量数据。此数据应保存在 CPU 内存中,并按顺序提供给 GPU 进行小批量计算。
内存传输时间是这个应用程序的主要瓶颈。我认为异步内存传输解决了这个问题,即在计算一个 minibatch 的过程中,另一个 minibatch 在后台传输到 GPU。
我想知道cupy.cuda.Stream
上课是否可行,但我还不知道。我将不胜感激任何意见/建议。
编辑:我认为以下代码会进行异步内存传输,但不是。
nvvp 显示内存传输是按顺序进行的。
python - 如何在chainer中实现批量线性链接,支持批量每个示例的不同权重?
我们chainer.functions.linear
用来计算y=Wx+b
.
就我而言,我必须实现一个多维的线性链接。
假设输入示例是(c, x)
,所需的输出是 then y = W_c x + b
。让我们忽略偏见并做到这一点y = W_c x
。
的基数{c}
是预先知道的(通常是样本类别)。
理论上,该W
参数可以实现为 3-d 张量(C, y_dims, x_dims)
。但还有什么?我是否必须遍历批次并提取W_c
形状(y_dims, x_dims)
并functions.linear
仅调用该(1, x_dims)
形状的示例?
chainer - 使用 Chainer 训练 MLP 时出错
我正在尝试训练和测试一个简单的多层感知器,就像在第一个 Chainer 教程中一样,但使用我自己的数据集而不是 MNIST。这是我正在使用的代码(主要来自教程):
我没有训练和打印预测值,而是在“trainer.run()”处收到以下错误:
我不知道如何处理错误。我已经使用其他框架成功地训练了类似的网络,但我对 Chainer 很感兴趣,因为它与 PyPy 兼容。
可在此处获得包含文件的 tgz:https ://mega.nz/#!wwsBiSwY!g72pC5ZgekeMiVr-UODJOqQfQZZU3lCqm9Er2jH4UD8
android - 如何从图像数据集创建模型并在 Chainer 中使用它?
我刚刚开始与 Chainer 合作。
我有以下要求,我想创建一个移动应用程序,android
用户可以在其中捕获道路上的图像,并且应用程序应该从该图像中识别一个或两个特定对象。例如,假设行人信号灯或斑马线。
用户将在路上拍照,从该图像中,我想识别这两个对象。
我有一组 1000 张pedestrian
世界各地不同类型信号的图像。我想创建一个模型,该模型可用于在比较从我的android
应用程序中的移动相机拍摄的图像之后使用。
我对对象检测有一些了解,cascade classifier
并SVM classifier
在过去使用过。
这可能与chainer
其他支持tools
的chainer
吗?
我一直在搜索,我确实得到了其他选项,比如OpenCV
and caffe2
,但我真的需要用chainer
.
任何帮助都会很棒。提前致谢。