问题标签 [faster-rcnn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
90 浏览

regression - mtcnn的train Pnet,bounding box回归acc很低!如何增加它?还是我的法律错了?

我使用 FDDB 人脸图片来训练 mtcnn 进行人脸检测。在 pnet 中,对于边界框回归,acc 保持在 60% 左右。有什么不对?

时期 397/400 1200/1200 [===============================] - 0s 131us/样本 - 损失:0.5068 - conv4_1_loss : 5.4316e-06 - conv4_2_loss: 0.5052 - conv4_1_accuracy: 1.0000 - conv4_2_accuracy: 0.5850 Epoch 398/400 1200/1200 [========================= =====] - 0s 131us/样本 - 损失:0.4350 - conv4_1_loss:3.8598e-06 - conv4_2_loss:0.4358 - conv4_1_accuracy:1.0000 - conv4_2_accuracy:0.5950 Epoch 399/400 1200/1200 [====== =====================] - 0s 131us/样本 - 损失:0.8905 - conv4_1_loss:5.0222e-06 - conv4_2_loss:0.8863 - conv4_1_accuracy:1.0000 - conv4_2_accuracy: 0.5817 纪元 400/400 1200/1200 [==============================] - 0s 124us/样本 - 损失:1.8505 - conv4_1_loss:3.0373e-04 - conv4_2_loss:1.8358 - conv4_1_accuracy:1.0000 - conv4_2_accuracy:0.5817

对于边界框 lebal,在 Positive train_set 中,我使用 FDDB 数据提供的可标记 x1,y1 x2,y2,只需根据图片的比例调整它们的大小。这是错的吗?Negative train_set,我设置 box lebal [0,0,0,0]

像这样:['./pos/20020816bigimg_932.jpg', 1, ['0.2857142857142857', '2.2857142857142856', '12.285714285714286', '14.285714285714286']]

0 投票
0 回答
39 浏览

python - 深度学习可以确定两个笔迹样本是否是同一个人的吗?

我之前曾在手写记录上使用过 Tesseract CNN OCR,并对准确性感到惊讶。我想知道,是否可以使用它或其他方法来确定笔迹样本是否由同一个人书写?

我一直在寻找解决方案,但除了手写 OCR 识别之外,很难获得任何结果。

0 投票
0 回答
140 浏览

python - 在 NVIDIA Jetson TX2 上将 COCO 权重加载到 Mask R-CNN 时出现问题:资源耗尽

我目前正在使用带有 Ubuntu 18.04 的 NVIDIA Jetson TX2 来使用我的自定义数据集训练 Mask R-CNN(Matterport 实现https://github.com/matterport/Mask_RCNN)。当我尝试加载时mask_rcnn_coco.h5,多次出现以下错误:

训练模型时,许多主题中都会出现相同的错误,但这里我只是尝试加载预训练的权重。我不明白为什么只使用一小块内存。

0 投票
1 回答
1033 浏览

python - 属性错误:GraphKey

这是回溯:

这是代码:

我试过使用 tf 版本 1 和 2。

0 投票
1 回答
2428 浏览

python - AttributeError:模块“tensorflow._api.v1.compat.v1.nn”没有属性“avg_pool2d”

有人可以帮我吗?

这是代码

它应该是 tf.nn.avg_pool2d(...) 是这样的吗?我确实在寻找解决方案。但我真的不明白。

0 投票
0 回答
59 浏览

python-3.x - 从图像识别车辆运动方向

我正在进行一项研究,以根据移动方向计算图像中的车辆数量。以下是示例图像。

在此处输入图像描述

目前我正在使用 YOLO 的 TensorFlow 实现和 fast-RCNN 来计算特定图像中的车辆数量。但是,我一直在确定运动方向。任何资源或指南都受到高度赞赏。

0 投票
0 回答
531 浏览

tensorflow - MultiLabelling 识别图像中多对象检测的子类

我想使用基于 YOLO 或 Faster RCNN 的方法对对象(尤其是骰子)进行分类。我正在使用自己的数据库,我想标记我的图像以便将其传递给我的模型。但是,我正在考虑使用LabelImg 这样做,但是我找不到任何方法来标记类和子类(即首先获取骰子的类型,然后是指定的面)。

有没有比标记我的图像两次(用于类型和面部)更简单的方法,然后将其传递给两个不同的模型?

谢谢各位,欢迎提出任何建议!

0 投票
1 回答
608 浏览

python - Mask-RCNN/TensorFlow:不同的图像格式(jpg、png)会影响Mask-RCNN的训练结果吗?

我在一个项目中使用了 Mask-RCNN 和 Tensorflow。我过去完成了许多培训。

在最近的一个中,我发现张量板中的损失曲线具有很大的冲击幅度。我在小范围内更改了一些设置,例如 batch_size,但它没用(在我看来)。

发现是第一次用.png来训练,这次训练之前用.jpg,可能这里有问题?</p>

先感谢您。

0 投票
2 回答
855 浏览

tensorflow - 如何仅在一个特定类上评估 Tensorflow 对象检测 API?

我已经使用 Tensorflow 对象检测 APIfaster_rcnn_inception_resnet_v2_atrous_coco在大约 10 个类上训练了一个对象检测模型。当我运行model_main.py文件来评估模型时,它似乎只给出了所有 10 个类的平均平均精度 (AP) 和平均召回率 (AR),如下所示:

但是,如果我只想评估 1 个特定类的性能,而不是所有 30 个检测到的类,我该怎么办?

0 投票
1 回答
33 浏览

python-3.x - 预期尺寸为 5,但得到形状为 (10000, 64, 173, 1) 的数组(GTZAN 数据集上的 CNN + LSTM)

我正在尝试在GTZAN数据集上实现 CNN + LSTM 架构。我将在下面解释我的训练和验证集:

我的模型如下:

模型编译:

模型适合:

但我得到一个错误说,

ValueError:检查输入时出错:预期 time_distributed_126_input 有 5 个维度,但得到了一个形状为 (10000, 64, 173, 1) 的数组

我究竟做错了什么?我是新来的