问题标签 [efficientnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
834 浏览

deep-learning - 展平 Efficientnet 模型

我正在尝试删除高效网络-pytorch 实现中的顶层。但是,如果我只是用我自己的全连接层替换最后_fc一层,正如作者在这个 github 评论中所建议的那样,我担心swish即使在这一层之后仍然有激活,而不是像我预期的那样没有任何东西。当我打印模型时,最后几行如下:

_fc我的替换模块在哪里。

我希望做的是:

在我看来base_model.children(),从嵌套结构中将模型展平。但是,现在我似乎无法像使用虚拟输入一样使用模型,x=torch.randn(1,3,255,255)我收到错误:TypeError: forward() takes 1 positional argument but 2 were given.

应该注意的是,model[:2](x)有效,但不是model[:3](x)model[2]似乎是移动块。

这是一个带有上述代码的colab 笔记本。

0 投票
1 回答
1280 浏览

python - 从 EfficientNet Tensorflow 中提取特征

我有一个使用 EfficientNetB6 训练的 CNN 模型。我的任务是通过移除最后一个密集层来提取这个训练模型的特征,然后使用这些权重来训练一个提升模型。我之前使用 Pytorch 做到了这一点,并且能够从我感兴趣的层中提取权重,并在我的验证集上进行预测,然后进行提升。

我现在在张量流中这样做,但目前卡住了。下面是我的模型结构,我尝试使用网站上的代码,但没有任何运气。 在此处输入图像描述

我想删除最后一个密集层并使用剩余层预测验证集。

我尝试使用:

layer_name = 'efficientnet-b6' intermediate_layer_model = tf.keras.Model(inputs = model.input, outputs = model.get_layer(layer_name).output)

但我收到错误“ValueError: Graph disconnected: cannot get value for tensor Tensor("input_1:0", shape=(None, 760, 760, 3), dtype=float32) at layer "input_1". 以下之前的图层访问没有问题:[]”

有什么办法可以解决这个问题?

0 投票
1 回答
448 浏览

tensorflow - 如何使用 TensorFlow Estimator 在 Amazon SageMaker 中获得可重现的结果?

我目前正在使用 AWS SageMaker Python SDK为我的数据训练 EfficientNet 模型 ( https://github.com/qubvel/efficientnet )。具体来说,我使用 TensorFlow 估计器,如下所示。此代码在 SageMaker 笔记本实例中

train.py 的代码包含通常的训练过程,从 S3 获取图像和标签,将它们转换为 EfficientNet 输入的正确数组形状,然后拆分为训练集、验证集和测试集。为了获得可重现的结果,我在调用 EfficientNet 模型本身之前使用以下 reset_random_seeds 函数(如果 Keras 结果不可重现,比较模型和选择超参数的最佳做法是什么? )。

但是,每次我运行笔记本实例时,我总是得到与上次运行不同的结果。当我将 train_instance_type 切换为“local”时,每次运行笔记本时总是得到相同的结果。因此,是否是我选择的训练实例类型导致的不可重现的结果?此实例 (ml.m5.xlarge) 有 4 个 vCPU、16 个内存 (GiB) 和没有 GPU。如果是这样,如何在这个训练实例下获得可重现的结果?

0 投票
3 回答
5279 浏览

python - importefficientnet.keras as efn - AttributeError: module 'keras.utils' has no attribute 'generic_utils'

我正在尝试使用来自https://github.com/qubvel/segmentation_models的 EfficientNet 。

所以,我通过 pip 安装了这个:

然后我尝试导入efficientnet.keras

并得到这个错误:

这很奇怪,因为它昨天工作没有任何问题,今天在一个笔记本上也是如此,但在其他笔记本上我得到了这个错误。有谁知道该怎么做?

0 投票
1 回答
32 浏览

python - 我如何解决深度学习的pytorch预测问题

给定groups=1size 的权重[48, 3, 3, 3],期望输入[5, 128, 129, 4]有 3 个通道,但是却得到了 128 个通道。

这是我的代码:

我不知道如何解决这个问题来预测我的竞争

0 投票
1 回答
370 浏览

tensorflow - EfficientDet 低准确度

我使用 TensorFlow 2.3 并测试了所有 EfficientDet 模型。在 TensorFlow github页面上写到,EfficientDet D7 的 mAP 比 NasNet 更高,为 51.5 > 43 Tf1_models。但是在测试数据中,我可以看到 EfficientDet 的准确率确实低于其他模型。为什么 NasNet 在 mAP 较低的情况下比 EfficientDet 准确得多?这里可以看到结果: Nas检测: 在此处输入图像描述

高效检测: 在此处输入图像描述

0 投票
1 回答
203 浏览

tensorflow - 有没有办法获得 hdf5 格式的高效网络预训练权重?

我在效率网络中获得预先训练的权重时遇到了一些问题。所以我搜索了efficientnet.hdf5,但找不到它。那么无论如何要获得hdf5格式的预训练权重。感谢你。

0 投票
1 回答
373 浏览

machine-learning - 可分离卷积层的 layer.get_weights() 是什么意思?

我了解到我们可以使用该函数layer.get_weights()来获取层的权重和偏差。这将返回一个长度为 2 的列表。层的权重存储在layer.get_weights()[0],偏差存储在layer.get_weights()[1](如果在定义层期间没有禁用偏差)。这对于普通的卷积层是正确的。

我最近使用可分离卷积层作为我在EfficientDet model.

当我尝试使用相同的layer.get_weights()函数时,它返回给我一个length 3我期望它2与上面相同的列表。在此,我对列表中的三个值是什么感到有些困惑。任何帮助和建议将不胜感激。

0 投票
1 回答
915 浏览

python - 将输入输入到 tensorflow.keras 模型的中间层

我正在尝试使用 tensorflow.keras.applications EfficientNetB0 实现一个 hydranet 架构。该架构的目标是将网络分成两部分(第一部分:主干,第二部分:头部)。然后,输入图像应该只提供一次到主干,并且应该存储它的输出。之后,这个输出应该直接馈送到头部(根据要分类的类的数量可以不止一个)。最佳方法:

  1. 我不想为每个头重绘整个模型。
  2. 主干应该只执行一次。

如果已经查看此论坛帖子:keras-give-input-to-intermediate-layer-and-get-final-output ,但提出的解决方案要么需要重新编码头部,要么不起作用。

我尝试了以下方法:

但是,当我尝试执行此操作时,两种方法都会出现“图形断开错误”:

我知道错误源于提供的张量不是输入张量的问题。这个问题有什么解决办法吗?

0 投票
1 回答
119 浏览

python - 自定义数据集上的 EffiecientDet mAP 评估

我正在尝试运行“mAP_evaluation.py”以对我自己的数据集进行 mAP 评估: https ://github.com/Tessellate-Imaging/Monk_Object_Detection/tree/master/4_efficientdet/lib

但是我认为整个 python 文件只是为 COCO 数据集制作的,但是如果我使用函数 evaluate_coco() 那么我不知道如何自定义我的数据集以匹配该函数。请帮忙。

P/S:我已经训练并导出了 EfficientDet 模型(pth 文件),预测的测试图像/视频,只是不知道如何评估。