问题标签 [imagenet]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

184 问题

0 投票

1 回答

223 浏览

deep-learning - Got confused after I extracted weights from Trained caffenet

So basically this are the dimensions of the weights from trained caffenet:

conv1: (96,3,11,11) conv2: (256,48,5,5) conv3:(384,256,3,3) conv4: (384,192,3,3) conv5:(256, 192, 3 , 3)

I am confused that although conv1 gives 96 channels as output why does conv2 only considers 48 while convolution? Am I missing something?

2018-03-01T18:33:07.440

0 投票

1 回答

1306 浏览

machine-learning - 获取 RuntimeError：图已断开：无法获取张量的值

我想通过检索其中一个名为“avg_pool”的层并将其转换为我的自定义层来创建 ResNet101 的自定义模型。我在另一个名为 resnet50 的预训练 Imagnet 模型中做了类似的事情，但在 Resnet101 中出现错误。我是迁移学习的新手，请指出我的错误是什么

machine-learning resnet pre-trained-model imagenet

2018-03-03T17:13:11.097

0 投票

1 回答

11365 浏览

imagenet - 如何从 Imagenet 中获取选定的类图像？

背景

我一直在玩Deep Dream和Inceptionism，使用Caffe框架来可视化层GoogLeNet，为项目构建的架构Imagenet，设计用于视觉对象识别的大型视觉数据库。

您可以在Imagenet此处找到：Imagenet 1000 类。

为了探究架构并产生“梦想”，我使用了三个笔记本：

这里的基本思想是从模型或“引导”图像的指定层中的每个通道中提取一些特征。

然后我们将希望修改的图像输入到模型中，并在指定的同一层中提取特征（对于每个八度音阶），增强最佳匹配特征，即两个特征向量的最大点积。

到目前为止，我已经设法使用以下方法修改输入图像和控制梦想：

(a) 应用层作为'end'输入图像优化的目标。（见特征可视化）

(b) 使用第二张图像来指导输入图像上的优化目标。

(c) 可视化Googlenet从噪声生成的模型类。

但是，我想要达到的效果介于这些技术之间，我还没有找到任何文档、论文或代码。

期望的结果（不是要回答的问题的一部分）

让一个属于给定层的单个类或单元'end'(a) 引导优化目标 (b) 并使该类在输入图像上可视化 (c)：

一个例子，其中class = 'face'和input_image = 'clouds.jpg'：

请注意：上面的图像是使用人脸识别模型生成的，该模型未在Imagenet数据集上进行训练。仅用于演示目的。

工作代码

方法（一）

我运行上面的代码：

方法(b)

我运行上面的代码：

问题

现在我尝试访问单个类的失败方法，对类矩阵进行热编码并专注于一个（到目前为止无济于事）：

为了明确这一点：问题不是关于梦想代码，这是有趣的背景并且已经是工作代码，而只是关于最后一段的问题：有人可以指导我如何获取所选课程的图像（上课#50: 'American alligator, Alligator mississipiensis'）从 ImageNet（这样我就可以使用它们作为输入 - 连同云图像 - 来创建一个梦想的图像）？

imagenet

2018-03-07T22:44:01.937

0 投票

1 回答

8892 浏览

tensorflow - ResNet34 - 使用 tensorflow 在 imagenet 上预训练的模型

有人可以指出我Resnet34使用 tensorflow 在 image-net 上预训练的模型吗？我不确定，但 TF-slim 训练的模型是相同的还是会有区别？

tensorflow resnet imagenet

2018-03-18T19:09:11.193

0 投票

1 回答

5314 浏览

python - ImportError：无法导入名称'string_int_label_map_pb2'

我使用以下命令编译了文件。

结果编译成 .py 文件。

但是，我收到以下错误代码。

~/Documents/imgmlreport/inception/classification_inception/models/research/object_detection/utils/label_map_util.py in ()

所以我检查了 utils，我已经有了一个 string_int_label_map_pb2.py

为什么不能导入 string_int_label_map_pb2.py ？

python tensorflow imagenet

2018-04-25T04:33:45.440

0 投票

1 回答

326 浏览

tensorflow - ValueError：无法为张量“ResizeBilinear：0”提供形状（1、26、38、3）的值，其形状为“（1、299、299、3）”

我尝试了使用 inceptionv3 train pb 文件的“object_detection”教程，但我遇到了以下错误：

因此，我尝试使用下面的代码来调整图像大小：

但是图像仍然无法传递给resizeBilinear张量。

我刚刚更改了这段代码：

我该如何解决这个错误？谢谢您的帮助！

tensorflow object-detection imagenet

2018-04-26T04:13:41.223

0 投票

2 回答

143 浏览

deep-learning - ImageNet 数据集是否包含带水印的图像？

我目前正在开发一个使用深度学习进行水印检测的项目。谁能判断 Image Net Data-set 是否包含水印图像？

deep-learning conv-neural-network imagenet

2018-06-06T11:18:33.130

0 投票

0 回答

312 浏览

keras - 用于单图像相机校准的 CNN

我一直在阅读一篇论文A Perceptual Measure for Deep Single Image Camera Calibration，他们采用了 DenseNet，最后一层被三个独立的头替换。

我从 keras 获取 DenseNet：

将 trainable 的层设置为 False 并以下列方式添加这些头：

不幸的是，这根本没有收敛：验证错误只是在训练时无限增长。我对训练数据非常确定，所以我目前的理论是头部应该更复杂一些。

有没有人实施那篇论文或知道这些头应该是什么样子？

keras camera-calibration imagenet

2018-06-12T08:04:01.053

0 投票

2 回答

975 浏览

dataset - 如何从 imageNet 下载图像和边界框以使它们具有匹配的名称？

我正在为特定的类进行对象检测，例如 chairs 。

我想从 imageNet 下载椅子的图像。我还想从 imageNet 下载注释 xml 文件（边界框）。

这两个东西都是在 imageNet 上提供的，我已经能够使用名为 ImageNet_Utils 的工具成功下载它们

https://github.com/tzutalin/ImageNet_Utils

但是下载的图像和边界框没有匹配的名称。所以不可能知道哪个 xml 文件是针对哪个图像的。

如何从 imageNet 下载图像和边界框，以使相应的图像和注释 xml 文件具有匹配的名称？

dataset bounding-box imagenet

2018-06-14T06:35:12.647

0 投票

2 回答

1960 浏览

python - TensorFlow/Keras - 预期 global_average_pooling2d_1_input 的形状为 (1, 1, 2048) 但得到的数组形状为 (7, 7, 2048)

我对 TensorFlow 和图像分类还很陌生，所以我可能缺少关键知识，这可能就是我面临这个问题的原因。

我已经ResNet50在 TensorFlow 中建立了一个模型，用于使用该库对犬种进行图像分类，ImageNet并且我已经成功地训练了一个可以检测各种犬种的神经网络。

我现在想将狗的随机图像传递给我的模型，以便它吐出它认为的狗品种的输出。但是，当我运行此函数时，当它尝试执行该行时dog_breed_predictor("<file path to image>")出现错误，我不知道如何解决这个问题。expected global_average_pooling2d_1_input to have shape (1, 1, 2048) but got array with shape (7, 7, 2048)Resnet50_model.predict(bottleneck_feature)

这是代码。我已经提供了我认为与问题相关的所有内容。

我输入函数的图像来自用于训练模型的同一数据集——我想看看模型是否按预期工作——所以这个错误使它更加混乱。我可能做错了什么？

python tensorflow keras resnet imagenet

2018-07-08T11:34:19.720

1 2 3 4 5 6 7 8 9 10

问题标签 [imagenet]

背景

期望的结果（不是要回答的问题的一部分）

工作代码

问题

Reference