问题标签 [imagenet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
41 浏览

machine-learning - 理解论文中关于 VGGNet 的一段话

我不明白文章中关于 VGGNet 的一段话。也许有人可以帮忙。

在我看来,卷积层中的权重数量是

其中 w 是过滤器的宽度,h 是过滤器的高度,d 是过滤器的深度,n 是过滤器的数量。

文章中写了以下内容:

假设三层 3 × 3 卷积堆栈的输入和输出都有 C 个通道,堆栈由 3*(3^2*C^2) = 27C^2 权重参数化;同时,单个 7 × 7 转换。层需要 7^2*C^2 = 49C^2 个参数。

我不明白,这里的渠道是什么意思,为什么使用这个公式。

谁可以给我解释一下这个?

提前致谢。

0 投票
1 回答
728 浏览

tensorflow - 解决 Keras 中庞大数据集的内存问题

我有这个使用 Keras 2.0.1 的代码,它是通过执行深度学习来进行图像识别的生成器。这段代码目前在 GPU 上运行时可以处理 1500 张图像,但是当我开始使用 50k 图像评估它时,我会遇到内存问题。我使用目录中的流来读取图像,使用 predict_generator 来获取预测和概率。以下是我得到的错误和我正在使用的代码:

错误:

代码

0 投票
1 回答
1150 浏览

tensorflow - 如何通过循环将 predict_generator 输出写入文件?

我有一个大型图像数据集,我想在其上运行 predict_generator。由于内存问题,我无法同时运行所有这些。这个想法是

通过循环图像范围并对其进行预测,将一小组图像迭代地馈送到生成器。

将预测保存到文件

稍后在循环中打开文件以读取所有预测以计算代码中提到的概率。

问题是如何将不同的预测保存在一个文件中。我尝试为文件创建一个 for 循环,但不确定它应该如何工作?如果有人可以为所定义的目标提供提示,那就太好了。

0 投票
1 回答
822 浏览

tensorflow - 如何在内存有限的大型数据集上运行 predict_generator?

目前我正在一次将所有图像提供给 predict_generator。我希望能够提供一小部分存储在 validation_generator 中的图像并对它们进行预测,这样大型数据集就不会出现内存问题。我应该如何更改以下代码?

0 投票
2 回答
325 浏览

neural-network - 在单类数据上训练多标签 CNN 会影响准确性吗?

我为多标签分类构建了一个 CNN,即预测每个图像的多个标签。

我注意到 ImageNet 和许多其他数据集实际上每个标签都包含一组示例。他们构造数据的方式是,给定一个标签,有一个该标签的示例列表。即:标签 -> 图像列表。此外,我正在使用的 Keras 支持每个标签的文件夹的数据结构,并且在每个文件夹中都有一个图像列表作为标签的示例。

我担心的问题是许多图像实际上可能有多个标签。例如,如果我对一般对象进行分类,名为“汽车”的单个文件夹将包含汽车图像,但某些汽车图像中也会包含人(并且可能会妨碍“人”类的结果)。

我的第一个问题:1)这(即地面实况中每个图像的单个标签)会降低网络的潜在准确性吗?

如果是这种情况,我想改为创建以下形式的数据集: image1,{list of its labels} image2,{list of its labels} 等

2)这样的结构会产生更好的结果吗?

3)关于这方面的一篇好的学术论文是什么?

0 投票
2 回答
2992 浏览

conv-neural-network - 在灰度图像网络上训练的 VGG16

我发现 VGG16 网络在(彩色)imagenet 数据库(如 .npy)上进行了预训练。是否有在可用的 imagenet 数据库的灰度版本上预训练的 VGG16 网络?

(在灰色 1 通道输入上使用 conv1.1 层的 3 通道过滤器的通常“技巧”对我来说还不够。我正在研究网络性能的增量改进,所以我需要看看当预训练模型“查看”灰度输入时,迁移学习的行为)。

谢谢!

0 投票
0 回答
263 浏览

tensorflow - 对于在 imagenet 上从头开始训练的模型(mobilenet、inceptionv2),Tensorflow slim 验证准确度约为 0

我从头开始在 imagenet 上训练了 tensorflow slim 默认模型,例如 mobilenetv1 和 inceptionv2。损失从 ~7 减少到 ~2,训练似乎很好。但是使用 eval_image_classifier.py 的验证准确度显示在 0 左右。从头开始训练的检查点用于验证准确度检查。

虽然我使用 tensorflow 提供的 mobilenetv1 的预训练检查点来检查验证准确性,但该网站声称的准确性约为 70%。

我也从零开始训练了darknet-19,验证准确率在60%左右,我在vgg16中加入了batch normalization,在imagenet上训练,验证准确率也在50%以上。

谁能告诉我为什么像 mobilenetv1 和 inceptionv2 这样从头开始训练的 slim 上的默认模型在验证时的准确率约为 0?

0 投票
1 回答
627 浏览

tensorflow - keras/tensorflow 找不到权重文件 imagenet

以下最小示例代码

失败了

即使在运行之前这样做:

然后它https://github.com/fchollet/deep-learning-models/releases/download/v0.4/xception_weights_tf_dim_ordering_tf_kernels.h5再次成功下载,但之后出现相同的错误。我错过了什么?

pip3在 Ubuntu 16.04 上使用 TensorFlow 版本 1.5.0(来自 tensorflow-gpu)。

0 投票
2 回答
2069 浏览

wordnet - Wordnet 同义词集 ID 有什么规则吗?

我是 Imagenet 和 Wordnet 数据库的新手。我正在尝试更粗略地重新分类 Imagenet 的图像和类别(例如“植物”、“鱼”、“人”……)。

我知道图像可以在 下载http://www.image-net.org/synset?wnid=[wnid],并且该文件将同义词集 ID 映射到相应的名词,但是是否有任何管理 ID 的规则(例如,ID 的每个数字是否表示某个类别或子类别?) .

0 投票
2 回答
1409 浏览

python - 使用 VGG16 预训练权重的 Imagenet 分类问题

我试图在 tensorflow 中使用 VGG16 网络运行 vanilla Image 网络分类(通过 Keras 主干提供 VGG16)。

然而,当我试图对一个大象样本图像进行分类时,它给出了完全出乎意料的结果。

我无法弄清楚可能是什么问题。

这是我使用的完整代码:

以下是我得到的示例输出:

Tensor("input_1:0", shape=(?, 224, 224, 3), dtype=float32)
Tensor("predictions/Softmax:0", shape=(?, 1000), dtype=float32)

[[('n02281406', 'sulphur_butterfly', 0.0022673723), ('n01882714', '考拉', 0.0021256246), ('n04325704', '偷走', 0.0020583202), ('n01496331', 021', 40, 026 电. ('n01797886', 'ruffed_grouse', 0.0020229272)]]

从概率上看,传递的图像数据似乎有问题(因为所有数据都非常低)。

但我无法弄清楚出了什么问题。
而且我非常确定这张照片是大象作为人类的形象!