问题标签 [imagenet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
957 浏览

tensorflow - 加载的 MobileNet 模型给出错误的预测

我正在尝试加载在TensorFlow中训练的mobilenet_v2_1.4_224(链接:https ://github.com/tensorflow/models/tree/master/research/slim/nets/mobilenet),并在GoLang中提供它。

问题是当我尝试用熊猫预测图像时,我得到了错误的预测。我的猜测是我下载了错误的 imagenet 标签文件。我上面提到的网络是在哪个 imagenet 数据集上训练的?

0 投票
0 回答
619 浏览

conv-neural-network - 使用 tiny-imagenet-200 数据训练模型 (resnet18/densenet) 时,Google colab 不断崩溃

我的 Google colab 在开始tiny-imagenet使用 10 万张图像和 200 个大小为 64*64 的类别进行训练后立即崩溃

Colab 日志显示

我正在使用model.fit_generator批量大小(从 32 到 1024 尝试)和图像大小(从 16 到 64 尝试)但没有任何效果。

我尝试resnet-18了具有 (1.8*10^9 参数) 的架构以及具有 80 万参数的自定义模型,但徒劳无功。

我将链接粘贴到我的 colab 以防有人需要其他信息 https://colab.research.google.com/drive/1QG1mg1zOn6gZaaSv4rrI4F6erdxsxQ8V#scrollTo=Uy0M-VDHivOX

0 投票
1 回答
792 浏览

validation - Imagenet ILSVRC2014 验证基本事实到同义词集标签翻译不准确

我使用预训练的图像分类器来评估输入数据处理。我下载了 ImageNet ILSVRC2014 CLS-LOC 验证数据集以用作基础。我需要知道图像的实际类别来评估我的治疗(需要检测正确的分类)。在 2014 年工具包中有 ILSVRC2014_clsloc_validation_ground_truth.txt 文件,根据自述文件,该文件应该包含数据集中 50 000 张图像的类标签(以 ID:s 的形式)。文件中有 50 000 个条目/行,所以到目前为止一切看起来都不错,但我也想要相应的语义类标签/名称。

我在网上的几个地方找到了这些,它们似乎是连贯的(1000 节课)。但后来我看了第一张图片,它是一条蛇,第一张图片的基本事实是 490,语义名称列表中的第 490 行是“链”。这很奇怪,但仍然很接近。第二张图片是两人滑雪,派生类“polecat”。我尝试了更多类似的结果。

我一定是误会了什么。基本事实不应该是验证集的“正确”答案吗?我错过了 ID:s 和语义标签之间的翻译吗?

2014 imagenet dev-kit 中的自述文件指出:“总共有 50,000 个验证图像。它们被命名为

每个同义词集有 50 个验证图像。

验证图像的分类基础事实在 data/ILSVRC2014_clsloc_validation_ground_truth.txt 中,其中每一行包含一个图像的一个 ILSVRC2014_ID,按图像文件名的字母升序排列。

验证图像的本地化基本事实可以 xml 格式下载。"

我这样做是我学士论文的一部分,我真的很想把它做好。

提前致谢

0 投票
1 回答
69 浏览

tensorflow - 尝试迁移学习时 imagenet 的密集层和卷积层之间的输入维度不匹配

我正在尝试在 InceptionV3 的卷积层之上训练密集层。但我无法初始化全连接模型。我收到一个 ValueError。

我希望模型能够成功编译,但我得到“ValueError:“Flatten”的输入形状未完全定义(得到(None,None,2048)。确保传递完整的“input_shape”或“batch_input_shape”参数到模型的第一层。”

0 投票
2 回答
3791 浏览

computer-vision - 从 imagenet 下载数据

我被告知以下“小狗”图像 URL 列表来自 imagenet。

https://github.com/asharov/cute-animal-detector/blob/master/data/puppy-urls.txt

如何下载另一个类别,例如“猫”?

我在哪里可以获得 imagenet 类别的完整列表以及它们在 csv 中的解释?

0 投票
2 回答
359 浏览

python-3.x - 图像预处理在 vgg16 中不起作用

我正在使用迁移学习(vgg16)学习图像分类,我正在使用 keras 的内置时尚 mnist 数据集。

为了预处理 vgg16 的数据,我通过从 keras.applications.vgg16 导入 preprocess_input 使用了以下命令

但我收到以下错误

我正在使用 keras2.2.4,点 19.0.3

0 投票
2 回答
86 浏览

object-detection - ImageNet Vid 对内部零对象帧评估的策略是什么

我正在尝试评估我的视频对象检测模块,为此我正在使用 InageNet VID 数据集。在某些时候,我面临评估包含零个对象的框架的情况。这意味着这一帧中没有地面实况 bbox(这很好,因为我们正在讨论视频对象检测)。

因为,我使用的模块预计至少存在 1 个 bbox,所以我想知道 ImageNet 对这些案例的官方处理是什么。我发现这个描述显然不是详尽的,它可能会在 ImageNet 站点中提供一些观点,其中指出:

评估指标与对象检测任务相同,这意味着未注释的对象将受到惩罚,重复检测(同一对象实例的两个注释)也会受到惩罚。

(原文如此;错字来自原文)

其中没有提到上述情况。由于这是一个简单的描述,我不确定它是否涵盖了所有边缘情况。通常在单图像对象检测中这不是问题,因为评估样本总是包含一些对象。但在这种情况下,这是否意味着我应该完全忽略这些框架?

此外,检查这个关于对象检测指标的存储库(顺便说一下,这是超级分析的),no gt 案例似乎属于关于False Positive (FP)的一般情况。在这种情况下, Intersection将为 0(因为不存在 gt bbox),并且Union将只是一个等于 FP bbox 的非零数,因此,IoU = 0.

那么,ImageNet 官方是如何处理这些情况的呢?我对这里的合理选择不感兴趣,只是官方版本。

0 投票
0 回答
442 浏览

json - KeyError:“class_name”正在加载 Keras json 文件

我已经在 imagenet 上为预训练的 resten50 下载了 json 和 h5 文件。但是,加载 json 文件会给我带来 keyerror。

我的代码:

我收到以下错误。

可能是什么问题?我恢复到 keras==1.2.2 但问题仍然存在。

0 投票
3 回答
15741 浏览

python - “DataLoader”对象不支持索引

我通过设置 download=True 通过这个 pytorch api 下载了 ImageNet 数据集。但我无法遍历数据加载器。

错误说“'DataLoader' 对象不支持索引”

我尝试了一种简单的方法,我只是尝试运行以下命令,

在根目录中,模式是

官方网站上的文档没有说别的。https://pytorch.org/docs/stable/torchvision/datasets.html#imagenet

我究竟做错了什么 ?

0 投票
1 回答
34 浏览

deep-learning - 预训练神经网络在图像中执行二值分割的有用性

我正在尝试对自定义数据集(在我的情况下为 DAGM 数据集链接到数据集)执行二进制分割

我只是想知道像 VGG、Resnet 这样的 imagenet 数据集上的预训练网络是否会有任何特殊用途,因为我不是要分割像猫、狗等这样的对象,而是图像中的异常。