问题标签 [imagenet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
deep-learning - Got confused after I extracted weights from Trained caffenet
So basically this are the dimensions of the weights from trained caffenet:
conv1: (96,3,11,11) conv2: (256,48,5,5) conv3:(384,256,3,3) conv4: (384,192,3,3) conv5:(256, 192, 3 , 3)
I am confused that although conv1 gives 96 channels as output why does conv2 only considers 48 while convolution? Am I missing something?
imagenet - 如何从 Imagenet 中获取选定的类图像?
背景
我一直在玩Deep Dream
和Inceptionism
,使用Caffe
框架来可视化层GoogLeNet
,为项目构建的架构Imagenet
,设计用于视觉对象识别的大型视觉数据库。
您可以在Imagenet
此处找到:Imagenet 1000 类。
为了探究架构并产生“梦想”,我使用了三个笔记本:
https://github.com/kylemcdonald/deepdream/blob/master/dream.ipynb
https://github.com/auduno/deepdraw/blob/master/deepdraw.ipynb
这里的基本思想是从模型或“引导”图像的指定层中的每个通道中提取一些特征。
然后我们将希望修改的图像输入到模型中,并在指定的同一层中提取特征(对于每个八度音阶),增强最佳匹配特征,即两个特征向量的最大点积。
到目前为止,我已经设法使用以下方法修改输入图像和控制梦想:
- (a) 应用层作为
'end'
输入图像优化的目标。(见特征可视化)- (b) 使用第二张图像来指导输入图像上的优化目标。
- (c) 可视化
Googlenet
从噪声生成的模型类。
但是,我想要达到的效果介于这些技术之间,我还没有找到任何文档、论文或代码。
期望的结果(不是要回答的问题的一部分)
让一个属于给定层的单个类或单元
'end'
(a) 引导优化目标 (b) 并使该类在输入图像上可视化 (c):
一个例子,其中class = 'face'
和input_image = 'clouds.jpg'
:
请注意:上面的图像是使用人脸识别模型生成的,该模型未在Imagenet
数据集上进行训练。仅用于演示目的。
工作代码
方法(一)
我运行上面的代码:
方法(b)
我运行上面的代码:
问题
现在我尝试访问单个类的失败方法,对类矩阵进行热编码并专注于一个(到目前为止无济于事):
为了明确这一点:问题不是关于梦想代码,这是有趣的背景并且已经是工作代码,而只是关于最后一段的问题:有人可以指导我如何获取所选课程的图像(上课#50: 'American alligator, Alligator mississipiensis'
)从 ImageNet(这样我就可以使用它们作为输入 - 连同云图像 - 来创建一个梦想的图像)?
tensorflow - ResNet34 - 使用 tensorflow 在 imagenet 上预训练的模型
有人可以指出我Resnet34
使用 tensorflow 在 image-net 上预训练的模型吗?我不确定,但 TF-slim 训练的模型是相同的还是会有区别?
python - ImportError:无法导入名称'string_int_label_map_pb2'
我使用以下命令编译了文件。
结果编译成 .py 文件。
但是,我收到以下错误代码。
~/Documents/imgmlreport/inception/classification_inception/models/research/object_detection/utils/label_map_util.py in ()
所以我检查了 utils,我已经有了一个 string_int_label_map_pb2.py
为什么不能导入 string_int_label_map_pb2.py ?
tensorflow - ValueError:无法为张量“ResizeBilinear:0”提供形状(1、26、38、3)的值,其形状为“(1、299、299、3)”
我尝试了使用 inceptionv3 train pb 文件的“object_detection”教程,但我遇到了以下错误:
因此,我尝试使用下面的代码来调整图像大小:
但是图像仍然无法传递给resizeBilinear
张量。
我刚刚更改了这段代码:
我该如何解决这个错误?谢谢您的帮助!
deep-learning - ImageNet 数据集是否包含带水印的图像?
我目前正在开发一个使用深度学习进行水印检测的项目。谁能判断 Image Net Data-set 是否包含水印图像?
keras - 用于单图像相机校准的 CNN
我一直在阅读一篇论文A Perceptual Measure for Deep Single Image Camera Calibration,他们采用了 DenseNet,最后一层被三个独立的头替换。
我从 keras 获取 DenseNet:
将 trainable 的层设置为 False 并以下列方式添加这些头:
不幸的是,这根本没有收敛:验证错误只是在训练时无限增长。我对训练数据非常确定,所以我目前的理论是头部应该更复杂一些。
有没有人实施那篇论文或知道这些头应该是什么样子?
dataset - 如何从 imageNet 下载图像和边界框以使它们具有匹配的名称?
我正在为特定的类进行对象检测,例如 chairs 。
我想从 imageNet 下载椅子的图像。我还想从 imageNet 下载注释 xml 文件(边界框)。
这两个东西都是在 imageNet 上提供的,我已经能够使用名为 ImageNet_Utils 的工具成功下载它们
https://github.com/tzutalin/ImageNet_Utils
但是下载的图像和边界框没有匹配的名称。所以不可能知道哪个 xml 文件是针对哪个图像的。
如何从 imageNet 下载图像和边界框,以使相应的图像和注释 xml 文件具有匹配的名称?
python - TensorFlow/Keras - 预期 global_average_pooling2d_1_input 的形状为 (1, 1, 2048) 但得到的数组形状为 (7, 7, 2048)
我对 TensorFlow 和图像分类还很陌生,所以我可能缺少关键知识,这可能就是我面临这个问题的原因。
我已经ResNet50
在 TensorFlow 中建立了一个模型,用于使用该库对犬种进行图像分类,ImageNet
并且我已经成功地训练了一个可以检测各种犬种的神经网络。
我现在想将狗的随机图像传递给我的模型,以便它吐出它认为的狗品种的输出。但是,当我运行此函数时,当它尝试执行该行时dog_breed_predictor("<file path to image>")
出现错误,我不知道如何解决这个问题。expected global_average_pooling2d_1_input to have shape (1, 1, 2048) but got array with shape (7, 7, 2048)
Resnet50_model.predict(bottleneck_feature)
这是代码。我已经提供了我认为与问题相关的所有内容。
我输入函数的图像来自用于训练模型的同一数据集——我想看看模型是否按预期工作——所以这个错误使它更加混乱。我可能做错了什么?