问题标签 [chainer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
38 浏览

chainer - 运行 ChainerCV 的“检测”演示时未获得正确的输出

我正在尝试从这里运行 ChainerCV 的“检测”演示, https://github.com/chainer/chainercv/tree/master/examples/detection

我在 AWS 上的BitFusion Ubuntu 14.04 Chainer AMI中运行此演示,并带有一个使用单个 GPU 的 p2.xlarge 实例。

当我一开始尝试运行这个演示时,我收到了这个错误,

没有显示名称,也没有 $DISPLAY 环境变量

所以我在网上对其进行了研究,得到了一个将 matplotlib 与 AGG 引擎一起使用的解决方案,所以我尝试导入它并使用 agg。这确实解决了 $DISPLAY 的问题,但是现在当我运行演示时,它会成功执行,但作为输出,我得到的只是一个白色的空白图像。

谁能告诉我这背后的原因?

0 投票
1 回答
216 浏览

chainer - 如何在小批量中累积梯度,然后在 Chainer 中反向传播?

我正在对视频序列进行分类,我需要两件事:

  1. 由于 GPU 内存有限,我想在 mini-batch 中累积梯度,然后平均梯度值,然后反向传播。

  2. 我需要知道如何在小批量之间随机播放,但不要在每个小批量内随机播放,因为我希望视频序列保持其顺序。

0 投票
0 回答
33 浏览

arrays - Chainer:如何从数组中删除均值以下的所有元素?

我在 Chainer 中有一个数组,我想删除所有为 0 或低于平均值的元素。

例如,给定数组 [0,1,2,3],我想以数组 [1] 结尾。使用 Tensorflow,tf.gather 可以做到这一点,但我找不到 Chainer 等价物。

提前致谢。

0 投票
1 回答
129 浏览

softmax - 如何在chainer中实现加权softmax

我正在重新制作一篇论文https://arxiv.org/abs/1711.11575:它有一个公式: 在此处输入图像描述

但是我搜索了chainer,它只有F.softmax,但它不能增加权重。如何重新实现该公式?

0 投票
1 回答
161 浏览

chainer - chainer StandardUpdater 迭代器参数

在链接器文档中,它显示在https://docs.chainer.org/en/stable/reference/core/generated/chainer.training.StandardUpdater.html#chainer.training.StandardUpdater

参数: iterator – 训练数据集的数据集迭代器。它也可以是一个将字符串映射到迭代器的字典。如果这只是一个迭代器,则该迭代器以名称“main”注册。

但实际上在chainer的代码中,我发现

这意味着它只使用名为“main”的迭代器字典?

0 投票
1 回答
139 浏览

chainer - chainer 如何像 multi-gpu 一样使用多 CPU

在chainer.dataset.to_device,我发现

参数:

device (int or None) -- 向其发送数组的设备 ID。如果为负值,则将数组发送到 CPU。如果为正,则将具有给定 ID 的数组发送到 GPU。如果为 None,则在原始设备中留下一个数组。x (numpy.ndarray 或 cupy.ndarray) -- 要发送的数组。

chainer 使用 0,1,2... 来表示 gpus 设备 ID。但是对于 cpu,我可以使用数字 -1,-2,... 来代表我要选择的不同 cpu 设备吗?

0 投票
1 回答
188 浏览

python - Chainer - Python - 逻辑回归

我使用 Python 和 Chainer 创建了一个简单的逻辑回归模型,但我对最终结果并不完全满意。因此,我想得到一些帮助。一个限制:我不想用已经存在的功能来交换实现的功能。我知道 Chainer 中的损失函数几乎相同,但我正在创建的一个更复杂的模型是使用自定义损失函数。代码可以在这里找到:

https://gist.github.com/kmjjacobs/62fc96ece695b47af8d667b060a64559

我想保持模型代码尽可能干净,但正如您所见,调用方法是对损失方法的转发,我怀疑在训练循环中调用损失方法有一种更简洁的方法。我认为如果调用方法输出预测并且有一个单独的损失方法来计算损失会更干净。您对此有何看法?

我也不确定转换器功能。有没有更好的方法来达到相同的结果?

你对编写 Chainer 代码有什么意见或最佳实践吗?

提前致谢!

0 投票
2 回答
7256 浏览

cuda - 可以在google colab上安装cupy吗?

我正在尝试在 google colab 上使用 GPU 运行 chainer。这需要安装cupy,但是我无法正确安装它,因为它在我的colab vm中找不到cuda环境。

错误信息如下...

收集 cupy 下载 cupy-2.4.0.tar.gz (1.7MB) 100% |███████████████████████████████ █| 1.7MB 740kB/s 命令 python setup.py egg_info 的完整输出:cc1plus:警告:命令行选项“-Wstrict-prototypes”对 C/ObjC 有效,但对 C++/tmp/tmpds3ikncy/a.cpp:1:10 无效:致命错误:cublas_v2.h:没有这样的文件或目录#include ^~~~~~~~~~~~~编译终止。选项:{'profile': False, 'linetrace': False, 'annotate': False, 'no_cuda': False} *********************** ****************************** * 警告:nvcc 不在路径中。*警告:请将路径设置为 nvcc。******************************************************包含目录:[] 库目录:[] 命令“x86_64-linux-gnu-gcc”失败,退出状态为 1 ************************* ************************* * 警告:未找到包含文件:['cublas_v2.h', 'cuda.h', 'cuda_profiler_api.h '、'cuda_runtime.h'、'curand.h'、'cusparse.h'、'nvrtc.h'、'nvToolsExt.h'] *警告:跳过安装 cuda 支持 *** 警告:检查您的 CFLAGS 环境变量 ************************************ ****************** Traceback(最近一次调用最后):文件“”,第 1 行,在文件“/tmp/pip-build-qu5red9h/cupy/setup.py”中,第 32 行,在 ext_modules = cupy_setup_build.get_ext_modules() 文件“/tmp/pip-build-qu5red9h/cupy/cupy_setup_build.py”,第 385 行,在 get_ext_modules extensions = make_extensions(arg_options, compiler, use_cython) 文件“/tmp/pip -build-qu5red9h/cupy/cupy_setup_build.py", line 275, in make_extensions raise Exception('Your CUDA environment is invalid.' Exception: Your CUDA environment is invalid. 请检查上面的错误日志。

命令“python setup.py egg_info”失败,错误代码 1 在 /tmp/pip-build-qu5red9h/cupy/

0 投票
1 回答
188 浏览

chainer - 如何在chainer中训练chainer.links.EmbedID?

我想自己训练标签嵌入,(是的,标签嵌入就像词嵌入一样,但输入是标签的一个热门向量)

当我发现chainer.links.EmbedID我在官方文档中找到示例时,它必须在其中传递 W。

如何训练嵌入 W 矩阵,然后我们可以用它来训练另一个模型?

我的意思是,如何训练词/标签的嵌入向量表示?

0 投票
1 回答
40 浏览

python - 包含多个示例的文件的 Chainer 迭代器,无需预加载

我有超过 100,000 个文件,每个文件包含 20 多个示例。每个文件的样本数不同。如何在 Chainer 中创建批量大小约为 10 的迭代器,而无需将所有文件预加载到内存中?