问题标签 [imagenet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
223 浏览

deep-learning - Got confused after I extracted weights from Trained caffenet

So basically this are the dimensions of the weights from trained caffenet:

conv1: (96,3,11,11) conv2: (256,48,5,5) conv3:(384,256,3,3) conv4: (384,192,3,3) conv5:(256, 192, 3 , 3)

I am confused that although conv1 gives 96 channels as output why does conv2 only considers 48 while convolution? Am I missing something?

0 投票
1 回答
1306 浏览

machine-learning - 获取 RuntimeError:图已断开:无法获取张量的值

我想通过检索其中一个名为“avg_pool”的层并将其转换为我的自定义层来创建 ResNet101 的自定义模型。我在另一个名为 resnet50 的预训练 Imagnet 模型中做了类似的事情,但在 Resnet101 中出现错误。我是迁移学习的新手,请指出我的错误是什么

创建自定义模型时出错

0 投票
1 回答
11365 浏览

imagenet - 如何从 Imagenet 中获取选定的类图像?

背景

我一直在玩Deep DreamInceptionism,使用Caffe框架来可视化层GoogLeNet,为项目构建的架构Imagenet,设计用于视觉对象识别的大型视觉数据库。

您可以在Imagenet此处找到:Imagenet 1000 类。


为了探究架构并产生“梦想”,我使用了三个笔记本:

  1. https://github.com/google/deepdream/blob/master/dream.ipynb

  2. https://github.com/kylemcdonald/deepdream/blob/master/dream.ipynb

  3. https://github.com/auduno/deepdraw/blob/master/deepdraw.ipynb


这里的基本思想是从模型或“引导”图像的指定层中的每个通道中提取一些特征。

然后我们将希望修改的图像输入到模型中,并在指定的同一层中提取特征(对于每个八度音阶),增强最佳匹配特征,即两个特征向量的最大点积。


到目前为止,我已经设法使用以下方法修改输入图像和控制梦想:

  • (a) 应用层作为'end'输入图像优化的目标。(见特征可视化
  • (b) 使用第二张图像来指导输入图像上的优化目标。
  • (c) 可视化Googlenet从噪声生成的模型类

但是,我想要达到的效果介于这些技术之间,我还没有找到任何文档、论文或代码。

期望的结果(不是要回答的问题的一部分)

让一个属于给定层的单个类或单元'end'(a) 引导优化目标 (b) 并使该类在输入图像上可视化 (c):

一个例子,其中class = 'face'input_image = 'clouds.jpg'

在此处输入图像描述 请注意:上面的图像是使用人脸识别模型生成的,该模型未在Imagenet数据集上进行训练。仅用于演示目的。


工作代码

方法(一)

我运行上面的代码:

方法(b)

我运行上面的代码:

问题

现在我尝试访问单个类的失败方法,对类矩阵进行热编码并专注于一个(到目前为止无济于事):

为了明确这一点:问题不是关于梦想代码,这是有趣的背景并且已经是工作代码,而只是关于最后一段的问题:有人可以指导我如何获取所选课程的图像(上课#50: 'American alligator, Alligator mississipiensis')从 ImageNet(这样我就可以使用它们作为输入 - 连同云图像 - 来创建一个梦想的图像)?

0 投票
1 回答
8892 浏览

tensorflow - ResNet34 - 使用 tensorflow 在 imagenet 上预训练的模型

有人可以指出我Resnet34使用 tensorflow 在 image-net 上预训练的模型吗?我不确定,但 TF-slim 训练的模型是相同的还是会有区别?

0 投票
1 回答
5314 浏览

python - ImportError:无法导入名称'string_int_label_map_pb2'

我使用以下命令编译了文件。

结果编译成 .py 文件。

但是,我收到以下错误代码。

~/Documents/imgmlreport/inception/classification_inception/models/research/object_detection/utils/label_map_util.py in ()

所以我检查了 utils,我已经有了一个 string_int_label_map_pb2.py

为什么不能导入 string_int_label_map_pb2.py ?

0 投票
1 回答
326 浏览

tensorflow - ValueError:无法为张量“ResizeBilinear:0”提供形状(1、26、38、3)的值,其形状为“(1、299、299、3)”

我尝试了使用 inceptionv3 train pb 文件的“object_detection”教程,但我遇到了以下错误:

因此,我尝试使用下面的代码来调整图像大小:

但是图像仍然无法传递给resizeBilinear张量。

我刚刚更改了这段代码:

我该如何解决这个错误?谢谢您的帮助!

0 投票
2 回答
143 浏览

deep-learning - ImageNet 数据集是否包含带水印的图像?

我目前正在开发一个使用深度学习进行水印检测的项目。谁能判断 Image Net Data-set 是否包含水印图像?

0 投票
0 回答
312 浏览

keras - 用于单图像相机校准的 CNN

我一直在阅读一篇论文A Perceptual Measure for Deep Single Image Camera Calibration,他们采用了 DenseNet,最后一层被三个独立的头替换。

我从 keras 获取 DenseNet:

将 trainable 的层设置为 False 并以下列方式添加这些头:

不幸的是,这根本没有收敛:验证错误只是在训练时无限增长。我对训练数据非常确定,所以我目前的理论是头部应该更复杂一些。

有没有人实施那篇论文或知道这些头应该是什么样子?

0 投票
2 回答
975 浏览

dataset - 如何从 imageNet 下载图像和边界框以使它们具有匹配的名称?

我正在为特定的类进行对象检测,例如 chairs 。

我想从 imageNet 下载椅子的图像。我还想从 imageNet 下载注释 xml 文件(边界框)。

这两个东西都是在 imageNet 上提供的,我已经能够使用名为 ImageNet_Utils 的工具成功下载它们

https://github.com/tzutalin/ImageNet_Utils

但是下载的图像和边界框没有匹配的名称。所以不可能知道哪个 xml 文件是针对哪个图像的。

如何从 imageNet 下载图像和边界框,以使相应的图像和注释 xml 文件具有匹配的名称?

0 投票
2 回答
1960 浏览

python - TensorFlow/Keras - 预期 global_average_pooling2d_1_input 的形状为 (1, 1, 2048) 但得到的数组形状为 (7, 7, 2048)

我对 TensorFlow 和图像分类还很陌生,所以我可能缺少关键知识,这可能就是我面临这个问题的原因。

我已经ResNet50在 TensorFlow 中建立了一个模型,用于使用该库对犬种进行图像分类,ImageNet并且我已经成功地训练了一个可以检测各种犬种的神经网络。

我现在想将狗的随机图像传递给我的模型,以便它吐出它认为的狗品种的输出。但是,当我运行此函数时,当它尝试执行该行时dog_breed_predictor("<file path to image>")出现错误,我不知道如何解决这个问题。expected global_average_pooling2d_1_input to have shape (1, 1, 2048) but got array with shape (7, 7, 2048)Resnet50_model.predict(bottleneck_feature)

这是代码。我已经提供了我认为与问题相关的所有内容。

我输入函数的图像来自用于训练模型的同一数据集——我想看看模型是否按预期工作——所以这个错误使它更加混乱。我可能做错了什么?