我一直在关注关于 WebRTC 的媒体服务器“Kurento”的非常有趣的教程,它允许直接通过浏览器进行多媒体通信。我在这里运行了教程http://www.kurento.org/docs/current/tutorials.html并发现它很有趣。
我现在的计划是实现一个非常基本的基于 WebRTC(或 Kurento)的对象检测/识别算法,给定一个简单的对象,它可以检测到它。为了做到这一点,我考虑了以下步骤。
假设我们希望找到水果,例如苹果和橙子:
- 第1步:我想在屏幕上放一个固定边界框,限制检测区域,比如美国绿卡拍照工具:http: //travel.state.gov/content/visas/en/general/photos.html
(用户脸部周围的绿色形状)
- 第2步:实现一个按钮,一旦按下它就可以告诉你边界框内的对象是苹果还是橙色(例如基于它的颜色或形状)
如果有想法,如果我能了解它们,我将不胜感激。谢谢