问题标签 [conv-neural-network]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
199 浏览

neural-network - 训练图像分类器 - 神经网络

我想训练一个卷积神经网络来检测图像中手的存在。

困难在于:1/ 图像将包含除手以外的其他对象,就像一组人的照片,其中手只是图像的一小部分 2/ 手可以有许多方向/形状等(无论它们是否是否打开,取决于角度等。)

我正在考虑在一大组裁剪的手部图像(+ 没有手部的随机图像)上训练卷积网络,然后将分类器应用于我图像的所有子方块。这是一个好方法吗?

还有其他复杂的 2 类 convnets / RNNs 的例子我可以用来作为灵感吗?

谢谢!

0 投票
0 回答
1655 浏览

machine-learning - torch - LookupTable 和梯度更新

我正在尝试实现具有多层的神经网络。我试图了解我所做的是否正确,如果不正确,我该如何调试。我这样做的方式是,我以以下方式定义我的神经网络(我使用一些先前学习的嵌入来初始化可查找层):

现在,为了训练网络,我遍历每个训练示例,并且对于每个示例,我调用 gradUpdate() ,其中包含以下代码(这直接来自示例):

findGrad 函数只是 WARP Loss 的一个实现,它返回梯度 wrt 输出。我想知道这是否就是我所需要的?我假设这将反向传播并更新所有层的参数。为了检查这一点,我训练了这个网络并保存了模型。然后我加载了模型并做了:

现在,我检查了 vector[1] 和 lookuptable.weight[1] ,它们是相同的。我不明白为什么查找表层中的权重没有更新?我在这里想念什么?

期待您的回复!

0 投票
1 回答
647 浏览

machine-learning - 将图像数据从pylearn2中的npy文件转换为灰度

我正在使用 pylearn2 训练一个简单的卷积神经网络。我将 RGB 图像数据存储在 npy 文件中。无论如何直接从npy文件将该数据直接转换为灰度数据?

0 投票
2 回答
1108 浏览

cuda - 为什么我在 Theano 中的 dropout 函数大大减慢了卷积速度?

我正在学习 Theano。我写了一个简单的 dropout 函数,如下所示:

当我将此函数应用于前两个卷积层的输入时,在每张图像上花费的平均时间从 0.5 毫秒增加到大约 2.5 毫秒!有谁知道这种急剧放缓的原因可能是什么?

我正在使用安装了 cuDNN 的 GTX 980 卡。

0 投票
1 回答
598 浏览

machine-learning - 如何在卷积神经网络中动态查找网络的深度

我一直在寻找一种自动方法来决定我应该将多少层应用于我的网络,具体取决于数据和计算机配置。我在网上搜索,但我找不到任何东西。也许我的关键字或查找方式是错误的。

你有什么主意吗?

0 投票
1 回答
385 浏览

machine-learning - 如何在pylearn2的隐藏层中使用leaky ReLus作为激活函数

我正在使用 pylearn2 库来设计一个 CNN。我想在一层中使用 Leaky ReLus 作为激活函数。有没有可能使用pylearn2来做到这一点?我必须为它编写一个自定义函数还是 pylearn2 有内置的函数?如果是这样,如何编写自定义代码?请问有人可以帮我吗?

0 投票
1 回答
184 浏览

machine-learning - 无法在 pylearn2 上编译 cuda_convnet 错误

我试图在 windows server 2012 上使用 pylearn2 编译 CNN。但是当我的网络包含 MaxoutConvC01B 时,它无法编译并给出错误消息,

RuntimeError: ('编译节点时出现以下错误', (GpuContiguous.0), '\n', 'Could not compile cuda_convnet')

请帮助解决此问题。

0 投票
1 回答
1178 浏览

javascript - 不理解来自 convnetjs 的训练数据

我正在尝试使用 javascript 中的神经网络来预测一些数据。为此,我发现convnetjs似乎很容易使用。

在示例中,他们使用了一种称为 MagicNet 的东西,因此您无需了解 NN 即可使用它。这是使用示例:

我不明白的是:他们创建训练数据[new convnetjs.Vol([1.3, 0.5]), new convnetjs.Vol([0.1, 0.7])],然后使用 2 个标签。这些标签是数组的每个位置还是这些位置的子数组的每个元素一个?

这是一个视觉示例:

是像[new 0, new 1]还是像[new convnetjs.Vol([0, 1]), new convnetjs.Vol([0, 1])]

0 投票
1 回答
4966 浏览

machine-learning - 如何将 .txt 转换为 .idx3-ubyte 格式?

我正在做一个基于卷积神经网络的项目,我正在使用 MNisT 数据库作为训练图像和测试数据。我想为 Kannada Digits 执行此操作,但我用于数据集的格式是 .txt,而我只采用 idx3-ubyte 格式的基本代码。请向我推荐任何可以将 .txt 文件转换为 .idx3-ubyte 的工具。

0 投票
2 回答
5991 浏览

computer-vision - Caffe 可以直接对图像的像素进行分类吗?

我想将图像的像素分类为“是街道”或“不是街道”。我有一些来自KITTI 数据集的训练数据,并且我看到 Caffe 有一个IMAGE_DATA图层类型。标签以与输入图像大小相同的图像形式存在。

除了 Caffe,我解决这个问题的第一个想法是在应该分类的像素周围提供图像补丁(例如,顶部/左侧/右侧/底部 20 个像素,导致每个像素有 41×41=1681 个我想要分类的特征.
但是,如果我可以告诉 caffe 如何使用标签而不必手动创建这些图像补丁(并且图层类型IMAGE_DATA似乎表明这是可能的)我更喜欢那样。

Caffe 可以直接对图像的像素进行分类吗?这样的 prototxt 网络定义会是什么样子?如何向 Caffe 提供有关标签的信息?

我猜输入层会是这样的

但是,我不确定究竟是什么crop_size意思。真的是居中吗?caffe 是如何处理角点像素的?new_height有什么new_width好处?