问题标签 [chainer]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

195 问题

0 投票

1 回答

64 浏览

chainer - chainercv 是否投影原始更快的 R-CNN caffe 代码的完整副本？

我找到了chainercv 项目：https ://github.com/chainer/chainercv 我已经阅读了这段代码，评论和代码非常好，但很少有细节仍然让我感到困惑。我想知道：此代码是否与https://github.com/rbgirshick/py-faster-rcnn的逻辑完全相同，这是原始的 caffe 实现。

chainer

2017-09-04T05:50:45.543

0 投票

2 回答

650 浏览

optimization - 亚当优化器在链接器中报告错误？

版本：chainer 2.0.2 我使用 Adam 优化器，然后报错，我发现是这个代码引起的（fix1==0？）：在adam.py：

错误日志：

optimization chainer

2017-09-04T11:13:47.510

0 投票

0 回答

103 浏览

chainer - 在chainer.Variable 中获取项目/切片不支持多GPU chainer.training.ParallelUpdater？

我有二维数组，当我使用以下代码计算损失时：

反向传播时，代码报错：

虽然我只使用了一个 GPU，但它出现了。这是什么原因造成的，我卡了很长时间。

chainer

2017-09-04T12:58:32.723

0 投票

1 回答

449 浏览

chainer - 为什么 NStepLSTM 没有 reset_state 方法？

我首先使用 L.LSTM ，然后我发现了这个 NStepLSTM，它是官方教程文档的一部分。 https://docs.chainer.org/en/stable/reference/generated/chainer.links.NStepLSTM.html?highlight=Nstep

为什么chainer.links.NStepLSTM 或chainer.links.NStepBiLSTM 没有reset_state？如何重置状态？
它是否传递了一个序列列表（每个都是一个序列链接器。变量，例如一篇文章包含多个单词是一个变量）？这个类的目的是处理不同长度的序列吗？
我们可以使用 truncate BPTT 来节省 chainer.links.NStepLSTM 中的内存吗？如何

chainer

2017-09-05T16:42:36.110

0 投票

1 回答

98 浏览

chainer - chainer.functions.get_item 究竟是如何反向传播的？

这个问题遵循chainer的切片或索引。在chainer中获取项目的变量是否具有向后能力？考虑一个典型的示例问题：假设我有卷积层 + FC 层，我的最后一个 FC 层输出一个向量。

因为在某些情况下我必须对向量进行切片来计算损失函数，例如，在多标签分类中，ground truth 标签向量大部分元素为 0，只有少数为 1，这种情况下，直接使用 F.sigmoid_cross_entropy 可能会导致标签不平衡问题，所以我决定使用 a[0, 1]( a is chainer.Variable output by last FC layer) 对特定元素进行切片来计算损失函数。

在这种情况下，最后一个FC层是如何进行梯度流（BP）的，它是如何更新其权重矩阵的？

chainer

2017-09-06T10:39:20.520

0 投票

1 回答

210 浏览

chainer - 如何在chainer.training.extensions.Evaluator中使用多个GPU？

因为我的训练模型在多个 GPU 上，所以在训练期间，我使用 trainer.extend 在每个时期验证我的模型，但是 chainer.training.extensions.Evaluator 只有一个设备参数，但我的模型网络参数在 2 个 GPU 上。在这种情况下如何验证？

chainer

2017-09-10T07:39:44.453

0 投票

2 回答

111 浏览

chainer - 如何控制chainer中的输入特征大小/尺寸？

例如，FC 层（L.Linear）需要 input_size 和 output_size ，但这只是为 FC 中的权重矩阵设置的。但是输入图像大小可以是任意的，如何控制限制输入图像大小或输入其他特征大小？

chainer

2017-09-22T13:07:01.780

0 投票

1 回答

388 浏览

chainer - 如何在chainer中使用xavier权重初始化器

我找到了这个页面：https ://docs.chainer.org/en/stable/reference/initializers.html

如何使用 xavier 权重初始化器在chainer 中初始化权重？

chainer

2017-09-25T15:59:39.867

0 投票

1 回答

536 浏览

cython - Cupy 会支持 cython（例如缓冲索引）吗？

我已经实现了自己定义的链接器链接，但是因为它太慢了。我已经实现了我的代码的 cython CPU 版本。但我想通过 GPU 进一步提高速度。所以我测试了以下代码，但它失败了：

报告：

cython chainer cupy

2017-10-01T08:39:48.280

0 投票

2 回答

585 浏览

python - 如何在chainer中设置损失重量？

首先，我向您讲述我的问题和情况。我想在chainer中做多标签分类，我的类不平衡问题非常严重。

在这种情况下，我必须对向量进行切片才能计算损失函数，例如，在多标签分类中，ground truth label vector大多数元素为0，只有少数为1，这种情况下，直接使用F.sigmoid_cross_entropy来申请所有的 0/1 元素都可能导致训练不收敛，所以我决定使用 a[[xx,xxx,...,xxx]] 切片（a is chainer.Variable output by last FC layer）对特定元素进行切片计算损失函数。在这种情况下，由于标签不平衡可能导致稀有类低分类性能，所以我想在反向传播期间设置稀有 gt-label 变量高损失权重，但在反向传播期间设置主要标签（在 gt 中出现太多）变量低权重.

我该怎么做？你对chainer中的多标签不平衡类问题训练有什么建议？

python chainer

2017-10-09T12:55:41.327

1 2 3 4 5 6 7 8 9 10

问题标签 [chainer]

Reference