问题标签 [faster-rcnn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regression - mtcnn的train Pnet,bounding box回归acc很低!如何增加它?还是我的法律错了?
我使用 FDDB 人脸图片来训练 mtcnn 进行人脸检测。在 pnet 中,对于边界框回归,acc 保持在 60% 左右。有什么不对?
时期 397/400 1200/1200 [===============================] - 0s 131us/样本 - 损失:0.5068 - conv4_1_loss : 5.4316e-06 - conv4_2_loss: 0.5052 - conv4_1_accuracy: 1.0000 - conv4_2_accuracy: 0.5850 Epoch 398/400 1200/1200 [========================= =====] - 0s 131us/样本 - 损失:0.4350 - conv4_1_loss:3.8598e-06 - conv4_2_loss:0.4358 - conv4_1_accuracy:1.0000 - conv4_2_accuracy:0.5950 Epoch 399/400 1200/1200 [====== =====================] - 0s 131us/样本 - 损失:0.8905 - conv4_1_loss:5.0222e-06 - conv4_2_loss:0.8863 - conv4_1_accuracy:1.0000 - conv4_2_accuracy: 0.5817 纪元 400/400 1200/1200 [==============================] - 0s 124us/样本 - 损失:1.8505 - conv4_1_loss:3.0373e-04 - conv4_2_loss:1.8358 - conv4_1_accuracy:1.0000 - conv4_2_accuracy:0.5817
对于边界框 lebal,在 Positive train_set 中,我使用 FDDB 数据提供的可标记 x1,y1 x2,y2,只需根据图片的比例调整它们的大小。这是错的吗?Negative train_set,我设置 box lebal [0,0,0,0]
像这样:['./pos/20020816bigimg_932.jpg', 1, ['0.2857142857142857', '2.2857142857142856', '12.285714285714286', '14.285714285714286']]
python - 深度学习可以确定两个笔迹样本是否是同一个人的吗?
我之前曾在手写记录上使用过 Tesseract CNN OCR,并对准确性感到惊讶。我想知道,是否可以使用它或其他方法来确定笔迹样本是否由同一个人书写?
我一直在寻找解决方案,但除了手写 OCR 识别之外,很难获得任何结果。
python - 在 NVIDIA Jetson TX2 上将 COCO 权重加载到 Mask R-CNN 时出现问题:资源耗尽
我目前正在使用带有 Ubuntu 18.04 的 NVIDIA Jetson TX2 来使用我的自定义数据集训练 Mask R-CNN(Matterport 实现https://github.com/matterport/Mask_RCNN)。当我尝试加载时mask_rcnn_coco.h5
,多次出现以下错误:
训练模型时,许多主题中都会出现相同的错误,但这里我只是尝试加载预训练的权重。我不明白为什么只使用一小块内存。
python - 属性错误:GraphKey
这是回溯:
这是代码:
我试过使用 tf 版本 1 和 2。
python - AttributeError:模块“tensorflow._api.v1.compat.v1.nn”没有属性“avg_pool2d”
有人可以帮我吗?
这是代码
它应该是 tf.nn.avg_pool2d(...) 是这样的吗?我确实在寻找解决方案。但我真的不明白。
tensorflow - MultiLabelling 识别图像中多对象检测的子类
我想使用基于 YOLO 或 Faster RCNN 的方法对对象(尤其是骰子)进行分类。我正在使用自己的数据库,我想标记我的图像以便将其传递给我的模型。但是,我正在考虑使用LabelImg 这样做,但是我找不到任何方法来标记类和子类(即首先获取骰子的类型,然后是指定的面)。
有没有比标记我的图像两次(用于类型和面部)更简单的方法,然后将其传递给两个不同的模型?
谢谢各位,欢迎提出任何建议!
python - Mask-RCNN/TensorFlow:不同的图像格式(jpg、png)会影响Mask-RCNN的训练结果吗?
我在一个项目中使用了 Mask-RCNN 和 Tensorflow。我过去完成了许多培训。
在最近的一个中,我发现张量板中的损失曲线具有很大的冲击幅度。我在小范围内更改了一些设置,例如 batch_size,但它没用(在我看来)。
发现是第一次用.png来训练,这次训练之前用.jpg,可能这里有问题?</p>
先感谢您。
tensorflow - 如何仅在一个特定类上评估 Tensorflow 对象检测 API?
我已经使用 Tensorflow 对象检测 APIfaster_rcnn_inception_resnet_v2_atrous_coco
在大约 10 个类上训练了一个对象检测模型。当我运行model_main.py
文件来评估模型时,它似乎只给出了所有 10 个类的平均平均精度 (AP) 和平均召回率 (AR),如下所示:
但是,如果我只想评估 1 个特定类的性能,而不是所有 30 个检测到的类,我该怎么办?
python-3.x - 预期尺寸为 5,但得到形状为 (10000, 64, 173, 1) 的数组(GTZAN 数据集上的 CNN + LSTM)
我正在尝试在GTZAN数据集上实现 CNN + LSTM 架构。我将在下面解释我的训练和验证集:
我的模型如下:
模型编译:
模型适合:
但我得到一个错误说,
ValueError:检查输入时出错:预期 time_distributed_126_input 有 5 个维度,但得到了一个形状为 (10000, 64, 173, 1) 的数组
我究竟做错了什么?我是新来的