问题标签 [convolutional-neural-network]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 我的 CNN 出了什么问题?
我真的不明白我的模型有什么问题。有时它给了我很好的结果,但在其他情况下,结果只是荒谬的。在训练期间,从一个时刻到另一个时刻,它给出了荒谬的结果。我尝试了有 3 个 dropout 层但没有它们的模型,得到了同样奇怪的结果。这是我的模型定义:
得到那种结果:结果截图
怎么了?而且,你知道我如何改进这个模型以获得更好的结果吗?
computer-vision - 扩张卷积,atrous,感受野
我不明白空洞卷积的感受野的值。实际上,例如,对于 3x3 的常规卷积,感受野是 3x3。两个 3x3 的感受野是 5x5。但是对于扩张卷积它是如何工作的?
事实上,一个 4 dilation 意味着 1 个卷积 3x3,然后我们应用另一个卷积 5x5(只有 9 个值与 0 不同),然后是一个卷积 7x7(只有 9 个值与 0 不同),最后是一个卷积 9x9?如果是这种情况,我不明白 4 膨胀的 15x15 的值。如果我的计算是正确的,我通过 3 次膨胀获得 13x13。我哪里错了?
tensorflow - 填充=相同时的Keras Conv2D尺寸计算
只是尝试使用 Keras,但在使用 padding=same 时我对 Conv2D 函数有点困惑。我想知道是否有人可以帮助我弄清楚当 padding="same" 时如何设置 p(填充)值?
这是一个代码示例:
您应该将尺寸读取为 (nr_samples, height, width, nr_channels)
如果 padding="same",高度和宽度将保持不变。但是我有点困惑 p 在计算尺寸时在这里取哪个值。
例如,尺寸高度应计算为:
height_next = ROUND_DOWN(((height_prev + 2xpadding - kernel_size) / stride) + 1)
height_next = height_prev = 2。如上所示,kernel_size = 2 以上。步幅 = 1。
所以.. 2 = ROUND_DOWN(((2 + 2xpadding - 2) / 1) + 1)
如果padding为2,则结果为5,不等于2。如果padding为1,则result为3,不等于2。如果padding为0,则result为1,不等于2 .
我假设填充需要是一个整数值。
Keras 在这里如何计算填充值?
c++ - 从 Dlib CNN 中提取图像
我正在用 C++ 实现一个带有 Dlib(19.4) 的 CNN。我的目标是可视化卷积。
我的代码是:
如何提取由 CNN 处理的图像?如何在 Dlib 中将张量转换为二维数组?
python - 带有 3D CNN 数据格式错误的 Keras ImageDataGenerator 流目录?
我是 Keras 的新手,我有一个包含多个文件夹的数据集,每个文件夹都指向一个特定的类。我使用 ImageDataGenerator 从子文件夹中读取数据。我正在尝试使用 16 个大小为 80x100 的连续帧,因此 input_shape 为 (16, 80, 100, 1)。当我进行训练时,网络输入出现错误,我知道输入应该是 3D CNN 的 5d 张量,但我不确定我是否正确执行此操作。
我正在使用 spyder 编写和实现代码:
错误说:
neural-network - U-net 与 FCN 背后的直觉用于语义分割
我不太明白以下内容:
在Shelhamer 等人提出的用于语义分割的 FCN 中,他们提出了一种像素到像素的预测来构建图像中对象的掩码/精确位置。
在用于生物医学图像分割的 FCN 的略微修改版本U-net中,主要区别似乎是“与收缩路径中相应裁剪的特征图的连接”。
现在,为什么这个功能特别适用于生物医学分割?对于生物医学图像与其他数据集,我可以指出的主要区别在于,在生物医学图像中,定义对象的特征集不如日常常见对象那样丰富。数据集的大小也是有限的。但是这个额外的功能是受这两个事实的启发还是其他原因?
python-3.x - CNN 的标签重塑
我在重塑数据以适应卷积神经网络时遇到问题。我尝试了很多解决方案,但仍然无法做到这一点。数据集包含 800 行和 271 列(最后一列包含类标签)。共有9个班。以下是我的代码:
反正有没有成功重塑变量来训练模型?谢谢!
machine-learning - 数据集的所有图像中是否存在特定对象会影响 CNN 的性能
背景:我的数据集中有不同类型车辆的尺寸视图的部分图像(部分图像,因为我的相机镜头的视野有限)。这些部分图像覆盖了一半以上的车辆,可以被认为是车辆的良好代表图像。车辆类别为轿车、公共汽车、卡车。我总是在这些图像中看到一个车轮,因为我在一天中的不同时间拍摄这些图像,所以车轮的颜色强度在一天中会发生变化。然而,所有图像中肯定存在一个轮子。
问题:我想知道在逻辑上对分类没有用处的数据集的所有图像中存在的对象是否会以任何方式影响 CNN。基本上我想知道在训练 CNN 之前我应该掩盖对象,即在所有图像中将其涂黑还是让它在那里。
python-3.x - 卷积神经网络的图像预处理
我想使用 CNN 用 tensorflow 制作蘑菇分类器。但是,我想知道图像数据预处理。我应该将图片背景删除为黑色还是只使用原始图片?
另外,如果我在cnn之前有任何预处理步骤,请告诉我。
python - 如何训练 Pytorch 网络
我正在使用Segnet的 Pytorch 实现,它带有我为对象分割找到的预训练值,它工作正常。现在我想使用具有相似图像的新数据集从我拥有的值中恢复训练。我怎样才能做到这一点?
我想我必须使用存储库中找到的“train.py”文件,但我不知道要写什么来替换“填充批处理”注释。这是代码的那部分: