问题标签 [faster-rcnn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1706 浏览

tensorflow - tensorflow中定义的faster_rcnn_resnet101在哪里(比如层在哪里)

我对机器学习真的很陌生,我目前正在使用 Tensorflow 对象检测 API 来执行对象检测,我使用的模型是 faster_rcnn_resnet101。

我正在寻找的是定义架构的python代码,例如层数(就像我附加的代码一样,它来自Tensorflow教程(https://cv-tricks.com/tensorflow-tutorial/training- convolutional-neural-network-for-image-classification/ )。Tensorflow 不像 YOLO,在那里我可以很容易地找到定义架构的地方......

非常感谢你的帮助!我想知道,在哪里可以找到定义架构的文件faster_Rcnn_resnet101

0 投票
1 回答
92 浏览

neural-network - 为我的 CNN 选择最佳池化类型

我可以发现最大池化是池化中最常用和首选的类型,无论我需要提取的图像数据或特征对我来说听起来多么可笑,例如我正在检测糖尿病视网膜病变,我需要从视网膜图像中提取一些微特征,为什么不选择平均池化或最小池化

0 投票
1 回答
847 浏览

validation - 专门在 Mask-R-CNN 中的测试和验证有什么区别?

我有自己的图像数据集并使用 Mask-R-CNN 进行训练。在那里,您将数据集划分为训练、验证和测试。

我想知道验证和测试之间的区别。我知道验证通常用于在每个时期之后查看 NN 的质量。基于此,您可以看到 NN 有多好以及是否发生过拟合。但我想知道 NN 是否基于验证集进行学习。

基于训练集,NN 在每个图像之后学习并调整每个神经元以减少损失。在 NN 完成学习后,我们使用测试集来看看我们的 NN 在处理新的看不见的图像时到底有多好。

但是在基于验证集的 Mask-R-CNN 中到底发生了什么?验证集是否仅用于查看结果?还是会根据验证结果调整一些参数以避免过拟合?即使是这种情况,验证集对参数有多大影响?神经元本身是否会被调整?

如果影响非常非常小,那么我会选择与测试集相等的验证集,因为我没有很多图像(800)。

所以基本上我想知道 Mask-R-CNN 中测试和验证之间的区别,即验证集如何以及在多大程度上影响 NN。

0 投票
1 回答
227 浏览

python - Keras 中用于图像分类的 CNN 类型是什么?

我有一个 CNN 架构,我训练它识别一些我最终需要实时使用的对象,然后使用检测到的对象的输出进行进一步的工作。我有两个问题需要回答,以评估我需要做的下一步:

  1. 随着我对 CNN 的研究更多,我发现有不同类型的 CNN,例如更快的 CNN。所以我想知道 Keras 在使用它的 conv2d 函数时使用的是什么类型的架构(我将在下面提供我的 CNN 架构的代码)

  2. 生成的模型帮助我识别我正在寻找的对象是否在图像中,但我也在寻找图像中的预测区域。这可能使用相同的架构还是我需要使用其他类似 YOLO 的东西?


编辑:更具体地说,我想知道 tensorflow 或任何后端 keras 是否提供了基础 CNN,我们定义架构的方式是定义我们使用的 CNN 类型,例如区域 CNN、快速 CNN 或更快美国有线电视新闻网?还是在不同级别定义的东西?

我希望我说清楚了。

0 投票
1 回答
142 浏览

tensorflow - RuntimeError:无法从输入流中解析字典

我对cntk完全陌生。我最近使用 GeForce 940MX GPU 在我的电脑(Windows 10,i5-7200U CPU)上安装了 cntk 2.7(GPU 版本)。我正在尝试设置 cntk 和以下链接中提供的更快的 rcnn 对象检测示例 https://docs.microsoft.com/en-us/cognitive-toolkit/object-detection-using-faster-r-cnn

我正在尝试运行玩具示例。

在 Examples/Image/Detection/FastRCNN 文件夹中运行 install_data_and_model.py 后

我运行 run_faster_rcnn.py Examples/Image/Detection/FasterRCNN 文件夹

我收到以下错误:

有人可以帮我解决问题的全部内容吗?

0 投票
1 回答
2329 浏览

tensorflow - tensorflow对象检测API的置信度

我正在通过 tensorflow 执行对象检测,但我面临的问题是对象检测不是很准确。我使用的架构是faster_rcnn_resnet_101.

更具体地说,我想解决的问题如下:

我正在尝试检测盒子,但我附加的图像将平板电脑检测为盒子,但置信度非常高(99%)。我想知道置信度是在哪里定义和打印的,因为我真的很好奇为什么平板电脑的置信度会像盒子一样高。我输入的所有训练数据都是像我检测到的那样的盒子。

这是物体检测的图像

谁能帮我找出 Tensorflow 对象检测 API 中定义的置信度在哪里?或者也许引导我解决这个问题?

0 投票
1 回答
1157 浏览

machine-learning - 大图像上的目标检测训练

尝试通过在4096 x 8192像素的图像上使用更快的RCNN来检测车牌。

我没有为训练调整大小,而是裁剪了图像的某些部分并标记了车牌并进行了训练,这样它就可以工作,但它无法在实际图像上检测到,而只能在小图像上检测到。

请指导我完成这项工作的最佳方法是什么。我应该如何进行培训,以及如何在faster_rcnn_inception_v2_pets.config上进行配置。或者,如果您认为更快的 RCNN 不适合这种工作,请提出更好的方法,我至少需要 80 以上的准确率。

我在谷歌上搜索了很多,但找不到任何人处理 8k 以上的图像。

我也在下面附上了一个示例图片。 https://ibb.co/NKWWd7q


我试图在谷歌云服务器上对4096 x 8192像素的图像进行带注释的训练,它在单个批量大小上消耗了超过 250gb 的 RAM。

亲切的问候。

0 投票
1 回答
390 浏览

tensorflow - 有什么方法可以修改可用的 TensorFlow 模型架构(例如 ssd 或 fast r-cnn),使其仅针对一个对象检测进行优化?

我是机器学习和 TensorFlow 的新手,所以很抱歉,如果我的理解有误,请纠正我。我有这个项目,使用 TensorFlow 开发实时交通信号灯检测。

我一直在使用预训练的 TensorFlow 模型,例如 SSD Mobilenet 和 Faster R-CNN Resnet。但是,还没有达到预期的精度结果。我已经考虑向数据集添加更多数据(我的数据集包含 +/-1000 张图像),但是因为添加更多数据需要做更多工作(因为我必须进行另一次数据采集并标记所有图像),这可能需要天。我想考虑另一种选择。

有什么方法可以修改 TensorFlow 模型架构,以便我可以优化并使其仅专注于交通信号灯检测?我一直在查看 TensorFlow 模型文件夹,但找不到这些模型架构在哪个文件中定义。

任何帮助将不胜感激。谢谢

0 投票
2 回答
1780 浏览

python - keras FRCNN 训练错误消息:异常:'a' 不能为空,除非没有采样

我正在使用 FRCNN 的这种实现来训练我的数据集:

https://github.com/kbardool/keras-frcnn

在训练期间,我得到没有堆栈跟踪的随机异常:

当我收到错误消息时,损失仍然下降,可能是什么原因,我该如何解决?

0 投票
1 回答
648 浏览

python - 表检测任务(TableBank & Detectron):UnicodeDecodeError:'ascii'编解码器无法解码位置 0 的字节 0x80:序数不在范围内(128)

我一直在尝试运行 python 脚本来测试预训练模型 (ResNeXt-101) 并可视化 TableBank 提出的表检测任务的性能。作者使用 Detectron 库(Facebook AI Research 的 (FAIR) 软件系统,实现了最先进的对象检测算法,包括 Mask R-CNN)对模型进行了预训练。我遵循了本教程:https ://github.com/doc-analysis/TableBank/blob/master/TestPretrainedModel.md

这是我的命令:

我得到以下信息:

有谁知道如何解决这个问题?任何帮助表示赞赏。