问题标签 [imagenet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5616 浏览

deep-learning - ILSVRC2012 验证 ground_truth 标签索引与预训练网络索引不匹配

我目前正在使用由 Lasagne 库提供的 VGG-S 预训练卷积神经网络,来自以下链接

我下载了 ILSVRC2012 的验证数据集以进行分类任务,但我看到文件 ILSVRC2012_devkit_t12_v2/data/ILSVRC2012_validation_ground_truth.txt 中的地面真值与 VGG-S 网络的所有输出值都不匹配( softmax 值)。

例如:最后一张图像 ILSVRC2012_val_00050000.JPEG 很明显是一只美洲驼,vgg-s 输出标签 n°355(美洲驼),而在文件中找到的地面实况标签是 n°186(诺里奇梗)。

index-to- label与此相同。

谁能告诉我我错在哪里?谢谢您的帮助。

0 投票
1 回答
972 浏览

neural-network - 咖啡 | 通过随机裁剪增加数据

我正在尝试在 Caffe 上训练我自己的网络,类似于 Imagenet 模型。但我对作物层感到困惑。直到我了解 Imagenet 模型中的裁剪层为止,在训练期间它将采用随机 227x227 图像裁剪并训练网络。但是在测试过程中,它将采用中心 227x227 图像裁剪,当我们从 256x256 图像中裁剪中心 227x27 图像时,我们不会丢失图像中的信息吗?第二个问题,我们如何定义训练期间要采取的作物数量?

而且,我训练了相同的网络(相同的层数,相同的卷积大小,FC 神经元会明显不同),第一次从 256x256 图像中裁剪 227x227,第二次从 256x256 图像中裁剪 255x255。根据我的直觉,裁剪为 255x255 的模型应该会给我最好的结果。但是我对 227x227 图像的精度越来越高,谁能解释一下它背后的直觉,还是我做错了什么?

0 投票
0 回答
132 浏览

tensorflow - 预训练的初始模型总是预测起重机

我正在使用 keras inception 预训练模型(使用 imagenet 数据) https://github.com/fchollet/keras/blob/master/keras/applications/inception_v3.py

我的短节目是

我尝试了 3 张图片,cropped_pa​​nda、rockcliff 和 pitcher。在每种情况下,预测都将起重机作为首选。确切的回报是

('预测:', [[(u'n03126707', u'crane', 0.77817649), (u'n04041544', u'radio', 0.098524272), (u'n03450230', u'gown', 0.084664099), (u'n02128925', u'jaguar', 0.015732178), (u'n03459775', u'grille', 0.011028509)]])

知道有什么问题吗?

0 投票
2 回答
3343 浏览

neural-network - 无论如何,YOLO 的表现会与 VGG-16 不同吗?将它用于图像分类而不是 VGG 有意义吗?

我已经使用 VGG 作为图像分类模型实现了图像字幕。我读过 YOLO 是一种快速的图像分类和检测模型,它主要用于多对象检测。但是对于图像字幕,我只想要类而不是边界框。

0 投票
1 回答
578 浏览

deep-learning - 有没有人从 imagenet 数据集中获得 Alexnet 的 PCA 噪声的特征值和特征向量?

有没有人从 imagenet 数据集中获得 Alexnet 的 PCA 噪声的特征值和特征向量?

imagenet 数据集有 1200 万张图像,我的计算机无法为这么大的图像集计算 PCA。我想知道是否有人做过并且可以发布特征值和特征向量的值。

0 投票
2 回答
2999 浏览

neural-network - 如何在 caffe 中选择批量大小

我知道更大的批量可以从这里得到更准确的结果。但我不确定哪个批量大小“足够好”。我想更大的批量大小总是会更好,但似乎在某个点上,每次增加批量大小只会稍微提高准确性。找到最佳批量大小是否有启发式或经验法则?

目前,我有 40000 个训练数据和 10000 个测试数据。我的批量大小是默认的,训练为 256,测试为 50。我正在使用具有 8G 内存的 NVIDIA GTX 1080。

0 投票
2 回答
649 浏览

python - 重新训练 Tensorflow 最终层,但仍使用以前的 Imagenet 类

我的目标是在 Tensorflow Inception 附带的现有 1000 个 Imagenet 类中“添加”更多类。现在我可以通过从头开始训练重新运行整个事情,bazel-bin/inception/imagenet_train但这需要很长时间,尤其是每次我想添加一个新类时。

是否可以使用bazel-bin/tensorflow/examples/image_retraining/retrain --image_dir ~/flower_photos但随后添加到现有的标签输出文件?

对不起,我是新手。

0 投票
2 回答
1438 浏览

python - Tensorflow imagenet_train 使用什么 train_dir 从头开始​​训练?

我正在关注以下页面

https://github.com/tensorflow/models/tree/master/inception

我到了必须运行的地步:

bazel-bin/inception/imagenet_train --num_gpus=1 --batch_size=32 --train_dir=/tmp/imagenet_train --data_dir=/tmp/imagenet_data

但是,我收到以下错误:

DATA_DIR/tmp/imagenet_data来自上一步bazel-bin/inception/download_and_preprocess_imagenet "${DATA_DIR}"

但我的会是什么train_dir?医生没有提到吗?看起来空文件夹不正确。

0 投票
1 回答
145 浏览

caffe - IMAGENET - 是否可以使用仅包含 10 个类的图像来训练 caffe alexnet

我曾经caffe/examples/cifar10训练模型进行分类,我想用这个结果来做可视化。但我发现 cifar10 图像都32*32太小而无法进行单位可视化。现在我想尝试使用另一个数据集,即 Imagenet。

但在我的情况下,我只想要 10 个类而不是 100 个类,就像 cifar-10 一样。我发现 IMAGENET 提供的数据太大,无法下载并提取这十个类。有什么可能的方法可以使用full url image从官方 imagenet 网站下载的内容。并下载选定的 10 个类以存储在我的磁盘中?因为我在文本文件上看不到任何标签(图像完整网址)。

0 投票
1 回答
1161 浏览

tensorflow - 将 DICOM 文件转换为 JPEG 文件以在 Inception V3 中使用

我正在尝试在一组医学数据图像上使用 Inception V3 模型。问题是数据是 DICOM 格式,不能与图像分类器一起使用。谁能告诉我如何将 DICOM 文件直接与 Inception V3 分类器一起使用。

Ps - 我通过 TensorFlow 提供的教程学会了使用分类器,并且在这方面相对较新。