问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
189 浏览

chainer - 如何在chainer v2.0中修复学习网络中的层参数?

假设我已经在其他数据库上预训练了网络。因为过拟合问题,我的数据库不是很多样化,所以过拟合问题很严重。我想在chainer v2.0中加载预训练的网络参数,但要修复前几层,在这种情况下,我应该在chainer v2.0中使用什么,我知道在chainer1.0中有volatile关键字,但在v2中已弃用.0.

在前几层处理时我应该使用with chainer.no_backprop_mode():inside吗?def __call__

0 投票
1 回答
138 浏览

chainer - 如何在chainer v2.1.0中使用mix link Multi-CPU的并行计算

在我的研究中。我在神经网络中写了2层,最底层的第一层是运行在GPU上的RNN,最上面的第二层是CPU(算法模型性质更适合CPU),我在chainer自定义Link中在CPU中实现。

但是,CPU 层很慢,我等不及我的论文提交的截止日期。所以我想使用这一层的并行计算。

实现并行此链接的最佳实践和快速方法是什么?

0 投票
1 回答
237 浏览

python - NStepLSTM 和 Seq2Seq 模型

亲爱的chainer社区,

我无法抗拒官方示例NStepLSTM中的逻辑用法(英文到法文翻译)。seq2seq

  1. def __call__(self, xs, ys): xs = [x[::-1] for x in xs] #Reverse x据我所知xs,这是一个英文短语,ys也是一个法语短语。你为什么把英文短语倒过来?

  2. 你如何训练网络?您将xs和嵌入ys到连续空间中,然后向编码器输入,exs以获得英语短语的潜在表示。但是然后你将潜在表示放入解码器中eys。但是eys是法语短语的连续表示,在测试阶段解码器无法知道生成的法语短语,可以吗?你如何应用你的网络?

    hx, cx, _ = self.the encoder(None, None, exs) _, _, os = self.decoder(hx, cx, eys)

  3. ys_in = [F.concat([eos, y], axis=0) for y in ys]为什么我们把它放在end of sequence开头?

  4. ys = self.xp.full(batch, EOS, 'i')def translate,我们将数组放入end of sequence解码器,为什么?

如果我不想翻译句子而是构建一个自动编码器来将短语映射到潜在空间,我该怎么办?

0 投票
1 回答
1055 浏览

python - Chainer 库的 `__init__.py` 文件中的“#NOQA”是什么意思?

我正在阅读 Chainer 源代码并注意到https://github.com/chainer/chainer/blob/master/chainer/init .py #L7

是什么#NOQA意思?

谢谢

0 投票
2 回答
113 浏览

chainer - 如何用chainer做外层产品?

如何将外部产品(先前的特征向量及其本身)包含在链接器中作为层,尤其是以与批处理兼容的方式?

0 投票
1 回答
2221 浏览

python - 使用 cupy 进行异步 GPU 内存传输

cupy是否可以使用(或)从/向 GPU 异步传输内存chainer

我正在训练一个相对较小的网络,其中包含不适合 GPU 内存的大量数据。此数据应保存在 CPU 内存中,并按顺序提供给 GPU 进行小批量计算。

内存传输时间是这个应用程序的主要瓶颈。我认为异步内存传输解决了这个问题,即在计算一个 minibatch 的过程中,另一个 minibatch 在后台传输到 GPU。

我想知道cupy.cuda.Stream上课是否可行,但我还不知道。我将不胜感激任何意见/建议。

编辑:我认为以下代码会进行异步内存传输,但不是。

nvvp 显示内存传输是按顺序进行的。

0 投票
1 回答
94 浏览

python - 如何在chainer中实现批量线性链接,支持批量每个示例的不同权重?

我们chainer.functions.linear用来计算y=Wx+b.

就我而言,我必须实现一个多维的线性链接。

假设输入示例是(c, x),所需的输出是 then y = W_c x + b。让我们忽略偏见并做到这一点y = W_c x
的基数{c}是预先知道的(通常是样本类别)。

理论上,该W参数可以实现为 3-d 张量(C, y_dims, x_dims)。但还有什么?我是否必须遍历批次并提取W_c形状(y_dims, x_dims)functions.linear仅调用该(1, x_dims)形状的示例?

0 投票
1 回答
280 浏览

python - 在chainer中使用数组作为MNIST数据的标签

python 模块链接器有一个介绍,它使用其神经网络从 MNIST 数据库中识别手写数字

假设一个特定的手写数字D.png被标记为3。我习惯于标签以数组的形式出现,如下所示:

但是,chainer使用整数标签代替:

数组标签对我来说更直观,因为输出预测也是一个数组。在不处理图像的神经网络中,我希望灵活地将标签指定为特定数组。

我在下面的链接器介绍中直接包含了代码。如果您通过数据集进行解析traintest请注意所有标签都是整数而不是浮点数。

我将如何使用数组作为标签而不是整数来运行训练/测试数据?

0 投票
1 回答
347 浏览

chainer - 使用 Chainer 训练 MLP 时出错

我正在尝试训练和测试一个简单的多层感知器,就像在第一个 Chainer 教程中一样,但使用我自己的数据集而不是 MNIST。这是我正在使用的代码(主要来自教程):

我没有训练和打印预测值,而是在“trainer.run()”处收到以下错误:

我不知道如何处理错误。我已经使用其他框架成功地训练了类似的网络,但我对 Chainer 很感兴趣,因为它与 PyPy 兼容。

可在此处获得包含文件的 tgz:https ://mega.nz/#!wwsBiSwY!g72pC5ZgekeMiVr-UODJOqQfQZZU3lCqm9Er2jH4UD8

0 投票
1 回答
175 浏览

android - 如何从图像数据集创建模型并在 Chainer 中使用它?

我刚刚开始与 Chainer 合作。

我有以下要求,我想创建一个移动应用程序,android用户可以在其中捕获道路上的图像,并且应用程序应该从该图像中识别一个或两个特定对象。例如,假设行人信号灯或斑马线。

用户将在路上拍照,从该图像中,我想识别这两个对象。

我有一组 1000 张pedestrian世界各地不同类型信号的图像。我想创建一个模型,该模型可用于在比较从我的android应用程序中的移动相机拍摄的图像之后使用。

我对对象检测有一些了解,cascade classifierSVM classifier在过去使用过。

这可能与chainer其他支持toolschainer吗?

我一直在搜索,我确实得到了其他选项,比如OpenCVand caffe2,但我真的需要用chainer.

任何帮助都会很棒。提前致谢。