问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
76 浏览

neural-network - 手动为chainer模型构建数据集时出错

当我使用手动数据集训练 NN 时出现错误。我的代码在这里。运行python train_with_manual_data.py --manual 1,输出错误为:

但是运行python train_with_manual_data.py --manual 0,不会有问题。不知道为什么,有人知道吗?先感谢您。

0 投票
0 回答
46 浏览

chainer - chainer 中的损失函数保持为零

我正在使用chainer,我尝试进行主题建模。训练阶段的代码包含以下内容:

当我执行我得到的代码时,例如:

只有 L(loss) 不会改变,有人可以帮忙知道为什么这个值保持为零吗?

0 投票
0 回答
179 浏览

python - Chainer - 在 ImageNet 子集上训练 GoogLeNet

我正在学习使用深度学习框架Chainer,但在 ImageNet 上训练 GoogLeNet 时遇到了麻烦。

我使用给定的示例并使用以下方法调用它:

我使用包含 5000 张图像的 ImageNet 子集,每个图像的大小调整为 256x256,并在需要时转换为 RGB。

我的损失甚至没有丝毫变化,如下面的日志所示。当我记录预测的类时,它总是在几次迭代后最终预测总是相同的类(但是当我再次运行它时,这个类会改变)。我仔细检查了我的数据集,一切似乎都很好,我使用 ImageNet 标签 ID,我的 txt 文件包含成对的路径和标签,每行一个。

由于它是来自官方仓库的代码,我猜我的子集有问题。我的预处理正确吗?5000 还不够吗(不是达到最先进的水平,而是真正学到一些东西)?

感谢您对可能出现问题的任何想法。

0 投票
1 回答
192 浏览

chainer - 如何识别chainer中的GPU内存瓶颈

我有一个 chainer 模型,它有时会由于cupy.cuda.memory.OutOfMemoryError. 由于它发生的确切位置取决于批次元素的大小,我想知道是否有一种方法可以识别链接器模型中的内存瓶颈?

0 投票
1 回答
44 浏览

chainer - 为什么我们需要在 Chainer 中分配 y 的 grad ?

我是Chainer的新手。我正在按照指南做。但是,我发现了一些我认为很奇怪的东西。在 Docs » Guides » Variable 章节中,我编写了 blow 代码:

然后,有一个错误,错误信息是:

当我们删除带注释的符号时,代码是:

然后一切正常。

所以似乎必须将初始grad分配给y的变量。我觉得这很奇怪。它应该是一个作为默认值吗?

我正在寻找你的解释,非常感谢你!

0 投票
3 回答
4662 浏览

python-2.7 - 无法使用chainer 4.1.0导入cupy

我在 python2.7.11 中有一个使用chainer 和cupy 的项目。将 Chainer 版本从 1.22 更新到 4.1.0 后,我无法使用 cupy

这是我安装chainer1.22的方式。无需安装cupy即可成功导入cupy。

查看

我可以看到 CUDA 可用于chainer1.22

所以我卸载了chainer 1.22

安装chainer 4.1.0

结果是

可以看到 cuda 不适用于 chainer 版本 4.1.0。所以我尝试用 pip 安装 cupy

安装时记录

无法构建 cupy 我检查了 nvcc 版本

当我尝试在chainer1.22环境下通过pip安装cupy时,也会出现同样的问题

这是我的环境

我引用了这篇文章 ,但它对我不起作用。

如何使用 CHAINER4.1.0 导入 CUPY?

感谢您阅读我的问题!

0 投票
1 回答
87 浏览

chainer - 使用 Chainer 进行扩展甚至观察是空的

我是 Chainer 的新手,最近我一直在与一个奇怪的情况作斗争。我有一个链来计算一个我用标签数据集提供的 CNN。但是当我使用扩展时没有结果出现。当我显示观察值时,它是空的。但是确实计算了损失并且更新了参数(至少它们改变了)所以我不知道连接问题在哪里。

也许这是完全错过的事情,这很明显。感谢您对我有很大帮助的所有评论。

Chainer4.1、Ubuntu16

0 投票
3 回答
4503 浏览

python - 如何使用chainer在google colab上从CPU切换到GPU?

我按照 Chainer 文档中的说明进行操作,这导致我在运行代码时出错:

然后我尝试以多种不同的方式安装cupy,其中之一是

导入cupy然后运行我的代码后,它一直给我同样的错误:

接下来我尝试使用这个安装cuda:

这花了很长时间,似乎工作但最后仍然给了我同样的错误。

在 Google Colab 的 GPU 上使用 Chainer 似乎非常困难,除非我做错了什么。使用 Tensorflow 就容易多了。有人有在 Google 的 GPU 上使用 Chainer 的经验吗?

0 投票
3 回答
307 浏览

python - python中的导入链接器引发错误

我得到错误:

模块“matplotlib.colors”没有属性“to_rgba”,

当我在 ipynb 中导入 chainer 时。
我正在使用 python 2、anaconda 4.1.1、chainer 4 和 matplotlib 1.5.1。任何人都可以评估这个问题

0 投票
0 回答
82 浏览

tensorflow - Chainer 中的 grad_outputs 与 Tensorflow 中的 grad 用于后向函数

我想将一些具有自定义渐变的自定义操作从 Chainer 转换为 Tensorflow。前传比较简单,我已经有了。但是对于向后传递,我永远无法使优化工作。让我们假设 Chainer 中的反向传递是这样的:

我在 Tensorflow 中通过以下方式做到了这一点:

根据我在网上找到的文档,我认为grad_outputsgrads的计算方式相同。但不知何故我失败了。

任何人都可以对此有所了解吗?那将不胜感激。