问题标签 [conv-neural-network]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
66 浏览

machine-learning - 使用 DNN 进行异常数字分类

我一直在思考这个问题有一段时间了,但我还没有找到一个我很满意的答案。

想象一下,我们已经在 MNIST 数字数据库上训练了一个 DNN,它以一定的高精度对样本外观察进行分类。然后我们向 DNN 展示 4 和 3 的异常图像,如下所示。DNN 会正确分类吗?我不这么认为,因为隐藏层根本不会具有图像中存在的具有不寻常数字(各种卷发)的特征,因此它可能会对它们进行错误分类。

我还认为仅对此类不寻常数字的数据库进行培训会很困难。隐藏层将如何存储(非常相似的)特征?直观地说,它会在这个 db 上过拟合,因为由于卷曲之间的相似性,隐藏的神经元将学习所有不必要的特征。

我认为训练这种 DNN 的方法是以某种方式学习组成数字的“条”/卷曲之间的角度,例如在数字“4”中,条之间有一个直角,但我不太确定。我也找不到处理这个问题的论文。

在此处输入图像描述

0 投票
1 回答
1134 浏览

computer-vision - 使用 lmdb 进行 caffe 多标签训练以对面部区域进行分类

我正在使用两个 lmdb 输入来识别脸部的眼睛、鼻尖和嘴巴区域。数据 lmdb 的维度为Nx3x Hx W,而标签 lmdb 的维度为Nx1x H/4x W/4。标签图像是通过在初始化为全 0 的 opencv Mat 上使用数字 1-4 屏蔽区域来创建的(因此总共有 5 个标签,其中 0 是背景标签)。我将标签图像缩小为相应图像的宽度和高度的 1/4,因为我的网络中有 2 个池化层。这种缩小可确保标签图像尺寸与最后一个卷积层的输出相匹配。

我的 train_val.prototxt:

在最后一个卷积层中,我将输出大小设置为 5,因为我有 5 个标签类。训练收敛,最终损失约为 0.3,准确度为 0.9(尽管一些消息来源表明这种准确度没有正确测量多标签)。使用经过训练的模型时,输出层正确地生成了一个尺寸为 1x5x H/4x W/4 的 blob,我设法将其可视化为 5 个单独的单通道图像。然而,虽然第一张图像正确突出了背景像素,但其余 4 张图像看起来几乎相同,所有 4 个区域都突出显示。

5 个输出通道的可视化(强度从蓝色增加到红色):
点击查看图片

原始图像(同心圆标记了每个通道的最高强度。有些更大只是为了与其他通道区分开来。正如您所看到的,除了背景之外,其余通道几乎在同一个嘴巴区域具有最高的激活,这不应该是这种情况。 )
点击查看图片

有人可以帮我找出我犯的错误吗?

谢谢。

0 投票
2 回答
133 浏览

lua - Torch 7 - 参数问题

当我在 torch 7 演示中看到这条线时,我很困惑;

例如在本文档第 147 行;

https://github.com/torch/tutorials/blob/master/2_supervised/4_train.lua

有谁知道在培训过程中这是要做什么?谢谢。

0 投票
1 回答
2703 浏览

deep-learning - 我可以在没有 GPU 的情况下训练深度卷积网络吗?

我正在考虑构建一个卷积神经网络作为跟踪系统应用程序。我感觉所有的深度网络应用程序都需要使用 GPU。有必要在像我这样的任务中使用 GPU 吗?我的笔记本电脑对 PC 的最低要求是什么?

0 投票
2 回答
381 浏览

filter - 卷积神经网络中特征图的过滤器

我应该使用哪种过滤器来提取卷积神经网络中的特征图?

我最近一直在阅读有关卷积神经网络的文章,我了解到我们使用一组过滤器在每个卷积层中生成一组特征图,方法是将这些过滤器与前一层的输出进行卷积。

1)我们如何获得这些过滤器?

2)我们是否随机选择过滤器并进行一些“反复试验”?

3)我们如何为我们的项目找到完美的过滤器?

谢谢你。

0 投票
2 回答
1188 浏览

tensorflow - Tensorflow 卷积神经网络 - 使用小数据集进行训练,对图像应用随机变化

假设我有一个非常小的数据集,只有 50 张图像。我想重用Red Pill教程中的代码,但在每批训练中对同一组图像应用随机变换,比如随机改变亮度、对比度等。我只添加了一个函数:

对旧代码的小改动:

第一次迭代成功,然后崩溃:

这与我在包含 50 个训练示例的个人数据集上遇到的错误完全相同。

0 投票
3 回答
3349 浏览

neural-network - 在使用 TensorFlow 训练 MNIST 后,我们如何识别真实图像上的文本?

我刚刚运行了代码来训练 MNIST 模型。我们如何应用它来识别真实图像中的笔迹?我是新手,刚刚开始学习这部分。我已经搜索并找不到有关此的信息。

0 投票
1 回答
5472 浏览

computer-vision - How to implement object detection by Caffe and CNN

I would like to implement object detection using Caffe framework and Convolution Neural Network, could you recommend some papers and demos about that?
I just need to know how to implement it.
If you can provide the source code, it will be perfect.

0 投票
1 回答
772 浏览

neural-network - Caffe:如何训练端到端(图像到图像)?

我们对caffe还很陌生,但到目前为止我们所看到的看起来确实很有希望。

在阅读了几篇论文(1、2 )之后,我们想重现 1 的结果特别是关于分段挑战4的结果

我们从3下载了修改后的 caffe并能够执行它,只是为了看看经过训练的网络无法使用4的数据集。

起初我们认为网络需要针对特定​​问题进行训练。这导致了如何进行“图像到图像(又名端到端)学习”(4,训练数据)的问题。

这导致我们使用了“整体嵌套边缘检测”(hed, 2),其中似乎使用了图像到图像的学习。使用 hed,我们能够自行重新训练网络。但它不起作用(如果我们尝试为4的数据集训练网络,它会导致所有 0 或 0.5 个图像 - 黑色图像 :-( ) 。对于初始化,我们编写了一个脚本来计算我们使用的均值图对于4的数据集。

我们的问题是:

或者

  • 你如何训练网络,我们有图像到图像的学习?
  • 由于我们只有 30 个图像到图像对,我们应该通过 matlab/python 实现1 / 3中提到的变形,还是 caffe 中已经有功能?
  • 我们是否遗漏了12中的一些简单内容?

亲切的问候,克劳斯和伯恩哈德

Ps:我们在 caffe-user 群问了同样的问题,打算在两个地方发布解决方案。

0 投票
1 回答
5816 浏览

neural-network - tensorflow.equal() op 上不兼容的形状用于正确的预测评估

使用 Tensorflow 的MNIST 教程,我尝试使用“人脸数据库”制作一个用于人脸识别的卷积网络。

图像大小为 112x92,我使用了 3 个以上的卷积层将其缩小到 6 x 5,如此处的建议

我是卷积网络的新手,我的大部分层声明都是通过类比 Tensorflow MNIST 教程做出的,它可能有点笨拙,所以请随时给我建议。

当会话运行“correct_prediction”操作时出现我的问题

至少我认为给出错误消息:

看起来 y_conv 输出形状为8 x batch_size的矩阵,而不是number_of_class x batch_size

如果我将批量大小从 20 更改为 10,则错误消息保持不变,但[8] vs. [20]我得到[4] vs. [10]。因此,我得出结论,问题可能来自y_conv声明(上面代码的最后一行)。

损失函数、优化器、训练等声明与 MNIST 教程中的相同:

感谢阅读,祝您有美好的一天