问题标签 [yolo]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
195 浏览

machine-learning - 对 YOLO 流程感到困惑

为了理解这个概念,我阅读了Mauricio Menegaz写的这篇文章,并在 YouTube 上观看了Deeplearning.ai 的视频,但我对 S x S x (B * 5 +C) 部分感到困惑。我知道 S x S 代表网格大小,5 代表边界框的组件,C 代表类。B 和锚盒一样吗?如果我只想检测一个类别(例如车牌),那是否意味着只有 1 个 B?

编辑在将图像输入神经网络之前是否在图像上创建了边界框?

0 投票
2 回答
4691 浏览

python - setup.py egg_info 错误代码 3221225477

我一直在尝试IMGAUG为 ML 项目安装包。但是在尝试安装时安装卡住了scikit-image

我的输入:pip install scikit-image

输出:

注意:我已经尝试过安装它的其他版本,升级 setuptools 和 pip。错误仍然存​​在。

PS:现在它出现在我尝试安装的所有东西上。

0 投票
1 回答
3237 浏览

python - ModuleNotFoundError:没有名为 darkflow.cli 和“nms”的模块

我正在https://github.com/llSourcell/YOLO_Object_Detection试用 YOLO 教程

当我执行此步骤时:

我收到了这个错误:

我试图到处寻找解决方案,但没有运气。然后我尝试跳过该行并继续...

我收到了这个错误:

任何帮助表示赞赏。谢谢

0 投票
2 回答
1779 浏览

tensorflow - 使用 Tensor 模型实现 yolo 模型

我正在研究使用 CNN 进行对象检测,我知道有几种模型,例如滑动窗口、基于区域的 CNN、基于快速区域和最后的 Yolo。我希望在张量流中实现 Yolo 模型并在网上搜索但找不到有用的东西。任何人都可以评论如何使用 Tensor 流实现 Yolo 模型,并且在同一张纸条上,我知道有一个用于对象检测的 Tensorflow API,使用这个 API 和直接应用 Yolo 模型有什么区别?任何有助于为此目的编写代码的在线材料。问候

0 投票
1 回答
321 浏览

bounding-box - 如何理解 YOLO 网格单元

“我们的系统将输入图像划分为一个 S * S 网格。如果一个物体的中心落入一个网格单元,则该网格单元负责检测该物体。”

这是来自YOLO论文,输入图像被划分为S*S网格,也就是说conv的输出是S*S的大小,对吧?

如果是这样,这些小细胞(7 * 7)如何连接到输入图像的原始区域?我知道 conv 是如何工作的,但是边界框是如何进行回归的呢?

0 投票
0 回答
295 浏览

object - 使用 yolo 检测文档中的文本部分

我想知道是否可以使用 Darknet Yolo 或其他对象检测算法来提取文档中的文本部分,例如 IRS 1099 表格——其中的文本区域形成不同的部分。可以训练 yolo 将文本部分作为对象吗?

0 投票
2 回答
814 浏览

python - darkflow - AttributeError:“NoneType”对象没有属性“find”

darkflow 和 python 的新手。我正在尝试使用https://github.com/thtrieu/darkflow和 yolo 权重来训练我自己的数据集。我目前遇到错误:

执行pascal_voc_clean_xml.py第 41 行时:'w = (imsize.find('width').text)'

这是来自https://github.com/thtrieu/darkflow/blob/master/darkflow/utils/pascal_voc_clean_xml.py的代码的一部分:

这是我的 xml 文件: 在此处输入图像描述

我知道'find'是python中ElementTree.py的一个函数,但为什么'find'函数不能正常工作?

0 投票
1 回答
9737 浏览

python-3.x - 从头开始实现 Faster Rcnn

我想从头开始构建自己的 Faster-RCNN 模型,用于从图像数据中进行多对象检测。

有人可以向我推荐一些好的资源来逐步实现faster-RCNN吗?

就准确性和执行时间而言,哪一个会是好的 YOLO 或更快的 RCNN?

0 投票
1 回答
511 浏览

python - Tensorflow:多尺度训练

我正在尝试在 Tensorflow 中训练类似于 YOLOv2 的多尺度 CNN:每隔几个时期随机调整输入批次的大小。但是我对Tensorflow不是很熟悉,下面是我获取批量图像和标签的方法:

然后我希望我可以调整输入批次的大小并输入网络

不幸的是,它不起作用,它只是在开始时调整批次的大小,并将调整大小操作应用于所有输入

有人对我应该做什么有建议吗?非常感谢

0 投票
1 回答
7194 浏览

cuda - pytorch 安装中的 CUDA HOME

我通过 conda 和 cuda 7.5 安装了 pytorch

除此之外,我没有为 cuda 进行任何其他安装,因为看起来 pytorch 带有 cuda

现在,我正在尝试设置 yolo2 https://github.com/longcw/yolo2-pytorch

但是,我在./make.sh命令中遇到错误

这是错误

OSError:nvcc 二进制文件无法位于您的 $PATH 中。将其添加到您的路径中,或设置 $CUDAHOME

我假设我需要在我的路径中设置 CUDAHOME,但我无法找到任何具有 nvcc 二进制文件的 cuda 目录。有什么指示吗?