问题标签 [convolutional-neural-network]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
418 浏览

machine-learning - 用于目标检测的 CNN 中损失函数的周期性行为

我正在尝试在 TensorFlow 中训练 CNN,以通过使用回归输出文本周围的边界框来执行图像中的文本定位。我通过将 IIIT 5K-Word 数据集中的图像粘贴到不包含文本的各种图像上创建了一个自定义数据集,并以 [pos_x, pos_y, width, height] 的形式为每个图像中的边界框创建了标签。每个图像仅包含一个文本,因此网络只需要预测每个图像的一个边界框。例如:

在此处输入图像描述

l2lossblog我得到的印象是 tensorflow 的 l2_loss 可能非常适合这项任务。然而,我的损失表现得非常奇怪,它以周期性模式振荡。仅仅因为超参数选择不当看起来太奇怪了,我怀疑我计算损失的方式有问题(例如下面)。除了 YOLO 和 R-CNN 等更复杂的模型之外,我还没有找到太多关于对象检测实现的信息。

这是我的模型:

训练 20 个 epoch 后,损失如下所示:

失利

我尝试将损失更改为 tf.reduce_mean(tf.nn.l2_loss(diff)) 以获得批次的平均误差,但它产生了相同类型的图。我如何计算批次的损失是否存在明显错误?

0 投票
2 回答
2068 浏览

python - 扩张卷积-反卷积的示例(张量流)

我正在尝试创建一个基于扩张卷积的自动编码器。我对不同的 suntax 以及向下/向上采样方法感到困惑。我们如何只为保留输入和输出大小的一层做到这一点?

- 通过使用tf.nn.atrous_conv2d然后tf.nn.atrous_conv2d_transpose

- 通过使用 tf.nn.conv2d 然后tf.nn.conv2d_transpose

提前致谢

0 投票
1 回答
613 浏览

keras - Keras:用于图像处理或变换的 CNN

我是 keras 和机器学习的新手。我的研究问题绝对可以从使用卷积神经网络 (cnn) 中受益。我正在尝试为特定于我的研究问题的某些图像转换构建一个 cnn。到目前为止,我遇到的大多数 cnn 示例都是某种形式的分类。对于分类示例,我了解 cnn 的基本操作,给定输入图像,网络会给出一个数字。将该数字与标签(与输入图像相关联)进行比较,然后将其中的误差反向传播到网络以调整下一次迭代的权重。对于我的转换问题,网络的输出是图像,而作为预期输出的“标签”也是图像。这就是我卡住的地方。如何使用图像作为标签,

谢谢你,在这件事上的任何指导将不胜感激。最好的,snsvsn

0 投票
1 回答
364 浏览

deep-learning - Softmax 输出层到底是什么?

我正在尝试在 c# 中制作一个简单的 conv 网络,并且我想制作一个 Softmax 输出层,但我现在不知道它是什么。它是具有 Softmax 激活的全连接层,还是仅输出数据的 softmax 的层?

0 投票
1 回答
1241 浏览

tensorflow - 使用 AMD 训练深度学习模型

我目前正在使用带有 AMD Radeon 显卡的联想 Ideapad PC。我正在尝试使用卷积神经网络运行图像分类器模型。数据集包含 50000 张图像,训练模型花费的时间太长。有人可以告诉我如何使用我的 AMD GPU 来加快进程。我认为 AMD 显卡不支持 CUDA。那么有什么办法吗?

PS:我使用的是 Ubuntu 17.10

0 投票
1 回答
255 浏览

machine-learning - Keras CNN 参数太少

我正在尝试在 keras 中使用 3 个输入和 sigmoid 激活函数重新创建以下教程 CNN:

在此处输入图像描述

所以参数的数量应该是 7(假设 1 个大小为 2 的过滤器在 2 个位置(前 2 个输入或 2 个较低输入)上卷积,2 个共享权重(在突触上显示为 1.0)并且在 conv1d 层中没有填充)。当我在 Keras 中编写以下内容时:

在此处输入图像描述

我签入时只得到5个参数model.summary()

在此处输入图像描述

我需要做什么才能获得正确数量的参数?因为我是 Keras 的新手,所以我的代码中可能有几处错误。

0 投票
0 回答
177 浏览

python-2.7 - 如果 Keras 上的连续卷积层,内核就会死亡

我正在使用以下使用 Keras 的卷积网络。

我不明白为什么每次我尝试训练我的模型时内核都会停止。如果你只是移除第二个卷积层(移除model.add(Conv2D(10, (3, 3), activation='elu'))),那么模型就适合了。

有谁知道为什么我不可能连续放置两个卷积层?

0 投票
2 回答
99 浏览

machine-learning - 架构 MNIST,全连接层 1,输出大小

我不明白其中的一部分(quora:ConvNet 的最后一层如何连接到第一个全连接层):

制作特征图的一个热门表示。所以我们将有 64 * 7 * 7 = 3136 个输入特征,这些特征再次由 3136 个神经元处理,将其减少到 1024 个特征。该层的矩阵乘法为 (1x3136) * (3136x1024) => 1x1024

我的意思是,使用 3136 个神经元将 3136 个输入减少到 1024 个特征的过程是什么?

0 投票
0 回答
361 浏览

tensorflow - 在 TensorFlow 中获取 Keras 模型的中间激活层

我有一个卷积 Keras 模型,我正在尝试获得一个 TensorFlow 图,该图将为我提供中间激活层,但我没有通过以下方式获得正确的结果:

我将结果的总和作为快速比较。我认为在 TensorFlow 中初始化变量时,它会重置所有权重,因为我每次都会得到一个随机结果。但是,它也不会让我在没有初始化的情况下运行。我这样做是因为我希望能够在 Go 中执行此操作,所以我尝试先在 Python 中使用 Keras,然后在 Python 中直接使用 TensorFlow,然后在 Go 中使用 TensorFlow。我想如果我可以让它在 TensorFlow 中工作,我可以将它保存到 Python 中的文件中,然后在 Go 中加载它。

0 投票
0 回答
173 浏览

tensorflow - 对象检测方法如何真正起作用?

我在学校的一个小组项目中,我们在Raspberry Pi 3中使用tensorflow 对象检测 API,但不知道对象检测方法SSD(单次检测器)和CNN(卷积神经网络)如何在下面工作.

有人可以就 SSD 和 CNN 的工作原理给出一个简单但不平凡的解释,并就可能优化对象检测方法速度的可能因素提出建议。

如果你知道的话,请把我们链接到好文章!