问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
64 浏览

chainer - chainercv 是否投影原始更快的 R-CNN caffe 代码的完整副本?

我找到了chainercv 项目:https ://github.com/chainer/chainercv 我已经阅读了这段代码,评论和代码非常好,但很少有细节仍然让我感到困惑。我想知道:此代码是否与https://github.com/rbgirshick/py-faster-rcnn的逻辑完全相同, 这是原始的 caffe 实现。

0 投票
2 回答
650 浏览

optimization - 亚当优化器在链接器中报告错误?

版本:chainer 2.0.2 我使用 Adam 优化器,然后报错,我发现是这个代码引起的(fix1==0?):在adam.py:

错误日志:

0 投票
0 回答
103 浏览

chainer - 在chainer.Variable 中获取项目/切片不支持多GPU chainer.training.ParallelUpdater?

我有二维数组,当我使用以下代码计算损失时:

反向传播时,代码报错:

虽然我只使用了一个 GPU,但它出现了。这是什么原因造成的,我卡了很长时间。

0 投票
1 回答
449 浏览

chainer - 为什么 NStepLSTM 没有 reset_state 方法?

我首先使用 L.LSTM ,然后我发现了这个 NStepLSTM,它是官方教程文档的一部分。 https://docs.chainer.org/en/stable/reference/generated/chainer.links.NStepLSTM.html?highlight=Nstep

  1. 为什么chainer.links.NStepLSTM 或chainer.links.NStepBiLSTM 没有reset_state?如何重置状态?

  2. 它是否传递了一个序列列表(每个都是一个序列链接器。变量,例如一篇文章包含多个单词是一个变量)?这个类的目的是处理不同长度的序列吗?

  3. 我们可以使用 truncate BPTT 来节省 chainer.links.NStepLSTM 中的内存吗?如何

0 投票
1 回答
98 浏览

chainer - chainer.functions.get_item 究竟是如何反向传播的?

这个问题遵循chainer的切片或索引。在chainer中获取项目的变量是否具有向后能力? 考虑一个典型的示例问题:假设我有卷积层 + FC 层,我的最后一个 FC 层输出一个向量。

因为在某些情况下我必须对向量进行切片来计算损失函数,例如,在多标签分类中,ground truth 标签向量大部分元素为 0,只有少数为 1,这种情况下,直接使用 F.sigmoid_cross_entropy 可能会导致标签不平衡问题,所以我决定使用 a[0, 1]( a is chainer.Variable output by last FC layer) 对特定元素进行切片来计算损失函数。

在这种情况下,最后一个FC层是如何进行梯度流(BP)的,它是如何更新其权重矩阵的?

0 投票
1 回答
210 浏览

chainer - 如何在chainer.training.extensions.Evaluator中使用多个GPU?

因为我的训练模型在多个 GPU 上,所以在训练期间,我使用 trainer.extend 在每个时期验证我的模型,但是 chainer.training.extensions.Evaluator 只有一个设备参数,但我的模型网络参数在 2 个 GPU 上。在这种情况下如何验证?

0 投票
2 回答
111 浏览

chainer - 如何控制chainer中的输入特征大小/尺寸?

例如,FC 层(L.Linear)需要 input_size 和 output_size ,但这只是为 FC 中的权重矩阵设置的。但是输入图像大小可以是任意的,如何控制限制输入图像大小或输入其他特征大小?

0 投票
1 回答
388 浏览

chainer - 如何在chainer中使用xavier权重初始化器

我找到了这个页面:https ://docs.chainer.org/en/stable/reference/initializers.html

如何使用 xavier 权重初始化器在chainer 中初始化权重?

0 投票
1 回答
536 浏览

cython - Cupy 会支持 cython(例如缓冲索引)吗?

我已经实现了自己定义的链接器链接,但是因为它太慢了。我已经实现了我的代码的 cython CPU 版本。但我想通过 GPU 进一步提高速度。所以我测试了以下代码,但它失败了:

报告:

0 投票
2 回答
585 浏览

python - 如何在chainer中设置损失重量?

首先,我向您讲述我的问题和情况。我想在chainer中做多标签分类,我的类不平衡问题非常严重。

在这种情况下,我必须对向量进行切片才能计算损失函数,例如,在多标签分类中,ground truth label vector大多数元素为0,只有少数为1,这种情况下,直接使用F.sigmoid_cross_entropy来申请所有的 0/1 元素都可能导致训练不收敛,所以我决定使用 a[[xx,xxx,...,xxx]] 切片(a is chainer.Variable output by last FC layer)对特定元素进行切片计算损失函数。在这种情况下,由于标签不平衡可能导致稀有类低分类性能,所以我想在反向传播期间设置稀有 gt-label 变量高损失权重,但在反向传播期间设置主要标签(在 gt 中出现太多)变量低权重.

我该怎么做?你对chainer中的多标签不平衡类问题训练有什么建议?