问题标签 [imagenet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 理解论文中关于 VGGNet 的一段话
我不明白文章中关于 VGGNet 的一段话。也许有人可以帮忙。
在我看来,卷积层中的权重数量是
其中 w 是过滤器的宽度,h 是过滤器的高度,d 是过滤器的深度,n 是过滤器的数量。
文章中写了以下内容:
假设三层 3 × 3 卷积堆栈的输入和输出都有 C 个通道,堆栈由 3*(3^2*C^2) = 27C^2 权重参数化;同时,单个 7 × 7 转换。层需要 7^2*C^2 = 49C^2 个参数。
我不明白,这里的渠道是什么意思,为什么使用这个公式。
谁可以给我解释一下这个?
提前致谢。
tensorflow - 解决 Keras 中庞大数据集的内存问题
我有这个使用 Keras 2.0.1 的代码,它是通过执行深度学习来进行图像识别的生成器。这段代码目前在 GPU 上运行时可以处理 1500 张图像,但是当我开始使用 50k 图像评估它时,我会遇到内存问题。我使用目录中的流来读取图像,使用 predict_generator 来获取预测和概率。以下是我得到的错误和我正在使用的代码:
错误:
代码
tensorflow - 如何通过循环将 predict_generator 输出写入文件?
我有一个大型图像数据集,我想在其上运行 predict_generator。由于内存问题,我无法同时运行所有这些。这个想法是
通过循环图像范围并对其进行预测,将一小组图像迭代地馈送到生成器。
将预测保存到文件
稍后在循环中打开文件以读取所有预测以计算代码中提到的概率。
问题是如何将不同的预测保存在一个文件中。我尝试为文件创建一个 for 循环,但不确定它应该如何工作?如果有人可以为所定义的目标提供提示,那就太好了。
tensorflow - 如何在内存有限的大型数据集上运行 predict_generator?
目前我正在一次将所有图像提供给 predict_generator。我希望能够提供一小部分存储在 validation_generator 中的图像并对它们进行预测,这样大型数据集就不会出现内存问题。我应该如何更改以下代码?
neural-network - 在单类数据上训练多标签 CNN 会影响准确性吗?
我为多标签分类构建了一个 CNN,即预测每个图像的多个标签。
我注意到 ImageNet 和许多其他数据集实际上每个标签都包含一组示例。他们构造数据的方式是,给定一个标签,有一个该标签的示例列表。即:标签 -> 图像列表。此外,我正在使用的 Keras 支持每个标签的文件夹的数据结构,并且在每个文件夹中都有一个图像列表作为标签的示例。
我担心的问题是许多图像实际上可能有多个标签。例如,如果我对一般对象进行分类,名为“汽车”的单个文件夹将包含汽车图像,但某些汽车图像中也会包含人(并且可能会妨碍“人”类的结果)。
我的第一个问题:1)这(即地面实况中每个图像的单个标签)会降低网络的潜在准确性吗?
如果是这种情况,我想改为创建以下形式的数据集: image1,{list of its labels} image2,{list of its labels} 等
2)这样的结构会产生更好的结果吗?
3)关于这方面的一篇好的学术论文是什么?
conv-neural-network - 在灰度图像网络上训练的 VGG16
我发现 VGG16 网络在(彩色)imagenet 数据库(如 .npy)上进行了预训练。是否有在可用的 imagenet 数据库的灰度版本上预训练的 VGG16 网络?
(在灰色 1 通道输入上使用 conv1.1 层的 3 通道过滤器的通常“技巧”对我来说还不够。我正在研究网络性能的增量改进,所以我需要看看当预训练模型“查看”灰度输入时,迁移学习的行为)。
谢谢!
tensorflow - 对于在 imagenet 上从头开始训练的模型(mobilenet、inceptionv2),Tensorflow slim 验证准确度约为 0
我从头开始在 imagenet 上训练了 tensorflow slim 默认模型,例如 mobilenetv1 和 inceptionv2。损失从 ~7 减少到 ~2,训练似乎很好。但是使用 eval_image_classifier.py 的验证准确度显示在 0 左右。从头开始训练的检查点用于验证准确度检查。
虽然我使用 tensorflow 提供的 mobilenetv1 的预训练检查点来检查验证准确性,但该网站声称的准确性约为 70%。
我也从零开始训练了darknet-19,验证准确率在60%左右,我在vgg16中加入了batch normalization,在imagenet上训练,验证准确率也在50%以上。
谁能告诉我为什么像 mobilenetv1 和 inceptionv2 这样从头开始训练的 slim 上的默认模型在验证时的准确率约为 0?
tensorflow - keras/tensorflow 找不到权重文件 imagenet
以下最小示例代码
失败了
即使在运行之前这样做:
然后它https://github.com/fchollet/deep-learning-models/releases/download/v0.4/xception_weights_tf_dim_ordering_tf_kernels.h5
再次成功下载,但之后出现相同的错误。我错过了什么?
我pip3
在 Ubuntu 16.04 上使用 TensorFlow 版本 1.5.0(来自 tensorflow-gpu)。
wordnet - Wordnet 同义词集 ID 有什么规则吗?
我是 Imagenet 和 Wordnet 数据库的新手。我正在尝试更粗略地重新分类 Imagenet 的图像和类别(例如“植物”、“鱼”、“人”……)。
我知道图像可以在 下载http://www.image-net.org/synset?wnid=[wnid]
,并且该文件将同义词集 ID 映射到相应的名词,但是是否有任何管理 ID 的规则(例如,ID 的每个数字是否表示某个类别或子类别?) .
python - 使用 VGG16 预训练权重的 Imagenet 分类问题
我试图在 tensorflow 中使用 VGG16 网络运行 vanilla Image 网络分类(通过 Keras 主干提供 VGG16)。
然而,当我试图对一个大象样本图像进行分类时,它给出了完全出乎意料的结果。
我无法弄清楚可能是什么问题。
这是我使用的完整代码:
以下是我得到的示例输出:
Tensor("input_1:0", shape=(?, 224, 224, 3), dtype=float32)
Tensor("predictions/Softmax:0", shape=(?, 1000), dtype=float32)[[('n02281406', 'sulphur_butterfly', 0.0022673723), ('n01882714', '考拉', 0.0021256246), ('n04325704', '偷走', 0.0020583202), ('n01496331', 021', 40, 026 电. ('n01797886', 'ruffed_grouse', 0.0020229272)]]
从概率上看,传递的图像数据似乎有问题(因为所有数据都非常低)。
但我无法弄清楚出了什么问题。
而且我非常确定这张照片是大象作为人类的形象!