问题标签 [conv-neural-network]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
12 回答
486493 浏览

cuda - 如何验证 CuDNN 安装?

我搜索了很多地方,但我得到的只是如何安装它,而不是如何验证它是否已安装。我可以验证我的 NVIDIA 驱动程序已安装,并且 CUDA 已安装,但我不知道如何验证 CuDNN 已安装。帮助将不胜感激,谢谢!

PS。
这是针对 caffe 实现的。目前,在没有启用 CuDNN 的情况下一切正常。

0 投票
1 回答
1867 浏览

python - 使用 cv2.imresize 调整数据大小以进行神经网络输入

我必须缩小数据以输入神经网络

我想使用cv2.imresize,但是关于它如何插入数据以缩小它有多种选择:

  • INTER_NEAREST - 最近邻插值
  • INTER_LINEAR - 双线性插值(默认使用)
  • INTER_AREA - 使用像素区域关系重采样。它可能是图像抽取的首选方法,因为它可以提供无莫尔条纹的结果。但是当图像被缩放时,它类似于
  • INTER_NEAREST 方法。
  • INTER_CUBIC - 4x4 像素邻域的双三次插值
  • INTER_LANCZOS4 - 8x8 像素邻域的 Lanczos 插值

有没有人尝试过这些,如果有,你发现了什么?注意:我没有足够的时间尝试学习各种插值。

0 投票
2 回答
738 浏览

neural-network - 带有 Caffe 和负或错误图像的卷积神经网络

当在 Caffe 深度学习(或任何 CNN 框架)上训练一组类(假设 #clases(类数)= N)并且我对 caffemodel 进行查询时,我得到该图像可能正常的概率百分比.

所以,让我们拍一张类似的 Class 1 的照片,我得到了结果:

1.- 96%

2.- 4%

休息... 0% 问题是:当我拍摄一张随机照片(例如我的环境)时,我不断得到相同的结果,其中一个类占主导地位(>90% 概率)但它不属于到任何班级。

所以我想听到的是那些经历过这种情况并且会解决如何处理对神经网络的无意义输入的人的意见/答案。

我的目的是:

  • 用负图像再训练一个额外的类(如 train_cascade)。
  • 使用 TRAIN 集中的所有正图像和 VAL 集中的负图像再训练一个额外的类。但是我的目的没有任何科学依据来执行它们,这就是我问你这个问题的原因。

你会怎么做?

非常感谢您提前。

拉斐尔。


编辑:

两个月后,我的一位同事给了我一个线索:激活函数。

我已经看到我在每一层都使用ReLU,这意味着当 x > 0 时 x 的值为 x,否则为 0。这些是我的图层:

如果我将任何 x 的 ReLU 设为 x(对于 x < 0 为负数),我的网络会收敛于准确度 = 0...

有更好的方法吗?

0 投票
1 回答
1314 浏览

neural-network - 用于时间相关特征的卷积神经网络

我需要从一系列图像中进行降维。更具体地说,每个图像都是一个球运动的快照,最佳特征是它的位置和速度。据我所知,CNN 是减少图像分类特征的最先进技术,但在这种情况下,只提供一个帧。给定不同时间步长的许多图像,是否也可以提取与时间相关的特征?否则,这样做的最先进技术是什么?

这是我第一次使用 CNN,我也将不胜感激任何参考或任何其他建议。

0 投票
1 回答
585 浏览

python - 卷积神经网络?

我正在做一个“情绪检测”项目。

作为制作完整产品的第一步,我们从图像处理开始。我从互联网上了解到卷积神经网络是最好的方法。

上面是我写的代码——值(850000,1100000)是矩阵的卷积范围之和的值(抱歉代码很粗糙,我今天早上开始写)。

那么我要问的问题是如何设计或获得将存储权重的矩阵。

1)对于每种对象检测,我可以只使用一个矩阵(即粗略的单层 CNN,它将为“汽车”和“人脸”提供不同的值)还是应该为“车”和“脸”?

2)如何处理同一物体的不同尺寸?我在 Internet 上看到的一种解决方案是不断调整原始图像的大小。我想知道是否有更快的方法?

3)在反向传播中,我们给出的获得优化权重矩阵的粗略条件是什么?

0 投票
1 回答
6102 浏览

image-processing - Haar级联方法与卷积神经网络?

我想知道在 haar 级联方法中,掩码大小是否是恒定的,并考虑到图像中不同大小的面孔,如果原始图像被缩小和放大以找出重叠。

我看到在卷积神经网络中,权重矩阵的大小是恒定的,比如 20*20

除此之外,我想知道 haar cascade 或 CNN 在人脸检测方面是否更快。如果是这种情况,我可以使用 haar 级联首先检测人脸的位置,然后进一步使用 CNN 来识别人脸。

Ps :-face 只是一个对象,它可以是任何其他东西,比如汽车、树.....

0 投票
1 回答
87 浏览

python - 不同图像的相同 fc6 响应

我按照过滤器可视化分类示例中的说明fc6从预训练模型(bvlc 参考模型)中获取对文件夹中多个不同图像的(完全连接的 layer6)响应,但对于所有图像,我得到相同的向量。这是我使用的代码:

PS:有没有什么简单的方法可以将这些数据存储在一个文件(如txt或csv)中,以供以后使用,无需使用Python即可读取和打开?

0 投票
1 回答
597 浏览

c++ - 如何理解 Cifar10 预测输出?

我已经为两类分类训练了Cifar10caffe )模型。行人和非行人。训练看起来不错,我已经更新了caffemodel文件中的权重。我使用了两个标签,1 用于行人,2 用于非行人,以及行人图像 (64 x 160) 和背景图像 (64 x 160)。训练后,我用正图像(行人图像)和负图像(背景图像)进行测试。我的测试prototxt文件如下图

为了测试,我使用test_predict_imagenet.cpp并做了一些修改,特别是路径和图像大小。

我无法弄清楚测试输出。当我用正面图像进行测试时,我得到的输出为

当我使用负面图像进行测试时,我得到的输出为

如何理解测试输出?

是否有任何更有效的测试算法来测试来自视频源的模型(从视频剪辑中逐帧)?

0 投票
3 回答
11192 浏览

c++ - 监控 Caffe 中的培训/验证过程

我正在训练用于对图像进行分类的 Caffe 参考模型。我的工作要求我通过在整个训练集和分别具有 100K 和 50K 图像的验证集上每 1000 次迭代后绘制模型的准确度图来监控训练过程。现在,我采取天真的方法,每 1000 次迭代后制作快照,运行读取原始 JPEG 图像并转发到网络并输出预测标签的 C++ 分类代码。但是,这在我的机器上花费了太多时间(使用 Geforce GTX 560 Ti)

有没有更快的方法可以让我在训练集和验证集上获得快照模型的准确性图?

我正在考虑使用 LMDB 格式而不是原始图像。但是,我找不到有关使用 LMDB 格式在 C++ 中进行分类的文档/代码。

0 投票
1 回答
149 浏览

python-2.7 - 卷积神经网络?

好的,我开始理解神经网络的概念,但我仍然无法理解卷积神经网络的用途/好处/实现,尤其是在图像处理方面。

我不明白的是如何检测不同大小的物体。

假设我们有一个 50*50 的权重矩阵和一个大小为 50*50 的训练集中的人脸。现在,当您获取矩阵的加权和时,它将返回一个特定值,例如 "X" 。所以现在我明白了这个想法是在整个图像上运行权重矩阵以锁定一个区域,该区域给出一个加权和为 ~"X" 现在你已经检测到一张脸。

如果上述理解是正确的,那么大小为 25*25 的图像如何在任何地方生成一个克隆到 "X" 的值。所以基本问题是如何处理图像的相对大小。

如果可能的话,请建议一些好的教程。