2

我有在我的工作场所使用的独特产品的图像。我无法想象初始数据库已经有类似的项目,它已经被训练过。

我尝试使用 YOLO 训练模型。这花了很长时间。时期之间可能有 7 分钟;由于数据量小,我想做 1000 个 epoch。

我在 1.0 GPU 上使用了 tiny-yolov2-voc cfg/weight。我有一个项目的视频,但我把它分成框架,这样我就可以注释了。然后我尝试在图像(不是视频)上进行训练。产品与医疗保健相关。基本上医院会使用的任何东西。

我还对从 Google 获得的图像使用了 inception 方法。我注意到 inception 方法非常快并且可以产生准确的预测。但是,我担心我的图像太独特而无法正常工作。

哪种方法最好使用?

如果你推荐 YOLO,你能提供一些关于如何加快训练阶段的建议吗?

如果您推荐 inception,您能否解释一下为什么它可以处理独特的图像?我想我很难理解 inception 如何知道我正在尝试训练哪个项目,而无需我提供注释。

提前致谢

4

2 回答 2

1

只是我的印象(没有推荐甚至相关经验)

查看与假设相关的硬件建议darknet是,您可能会储备自己的硬件以获得更快的结果。
我阅读了当前三个不同版本的YOLOGFLOPS 培训,如果您下载推荐的文件,我预计其中包含大量的 GFLOPS 培训,但如果这些模型不适合您的产品,那么对您来说,它们可能永远不会很有帮助。
我必须承认我既不积极参与YOLO也不积极参与Tensorflow,所以我的印象可能根本没有帮助。
如果你看到一些视频YOLO您可以注意到,有时骆驼被贴上了马的标签,准确度似乎很差,但这取决于应用于图像的阈值,所以视频看起来很棒,因为它似乎识别完成得如此之快,但过程的准确度更高会放慢速度 - 也取决于训练有素的动机。
不过他们从不隐藏它,他们在一张图片上解释说,狗被标记为牛,马被标记为羊(第 2 版),结合暗网,它变得更快但也不那么准确,因此暗网的使用也是一个重要方面.
的网站上有关细节的信息似乎很糟糕,YOLOTensorflow看起来更具学术性,并且正在告知框架背后的数学。
关于Tensorflow我不知道硬件建议,但是当你写你的结果很有用时,它们可能有点甚至更少。
我的印象是,YOLO它主要用于(实时)视频中的实时检测,需要大量培训才能获得高精度。因此,根据您的用例,它可能是正确的,但您可能会为专业用途投资硬件。
这不是反对意见,Tensorflow但我必须进行更多验证,而且似乎需要更多时间才能获得印象。目前我什Tensorflow至不能说它是否可以用于实时检测,它的准确度如何,结果是否仍然优于那些YOLO.

我的假设是,关于这两种解决方案,这是一个涉及元素的问题(比如决定是否包括暗网以提高速度)、配置、培训和调整。可能总有一些东西可以提高速度和准确性,因此投资识别系统不会是时间线固定的静态过程,而是一个稳定的过程。

这只是我印象的简短概述,我从来没有任何识别软件的经验,并且几乎不建议您根据我的话做出任何决定。
如果您想使用任何专业的识别软件,尤其是实时识别,那么您可能必须投资硬件。

于 2018-06-18T04:51:09.097 回答
0

根据我对您的问题的理解,您需要具有识别独特图像的能力。在这种情况下,您可以在初始模型上使用迁移学习。通过迁移学习,您仍然可以在保留之前的 inception 知识的同时训练自己的图片。

更多关于迁移学习

于 2018-11-17T01:19:18.053 回答