0

上周我选择了我的主要项目。这是一个基于视觉的系统,用于监控骑自行车的人在计时赛中通过赛道上的某些点。它应该检测骑车人背部的亮黄色比赛号码并从中提取号码,并记录时间。我对此进行了一些研究,并决定使用 Robert Theis 的 Tesseract Android 工具,称为 Tess Two。为了加快识别文本的过程,我想使用一个事实,即从骑车人背部的明亮(黄色)矩形中提取数字并将实际 OCR 仅集中在其上。我还没有找到任何代码或任何想法如何检测具有特定颜色的几何图形。感谢您的任何帮助。很抱歉,如果我犯了任何错误,我在这个网站上还是个新手。

4

1 回答 1

1

图片来自哪里?我问是因为我被要求为类似应用程序的设计提供一些技术帮助(我们正在使用足球运动员的衬衫),我可以告诉你你会遇到一些问题:

  • 使用高质量的视频源,而不是依赖几个数码相机图像。由于骑手的运动,该数字几乎肯定会“弯曲”或扭曲,并且能够使用一系列图像有时可以让您根据一系列“错误读数”计算出它的真正数字
  • 训练您使用的字体,但也要尽可能多地应用逻辑(如果数字始终是两位数并且从不以“9”开头,请使用此信息来帮助您获得正确的数字
  • 如果您有能力放置相机(我们没有!),我会认为您的理想位置应该在骑手上方并稍微向前看,这样您就可以以最小的失真捕捉他们的背部。
  • 我们发现将视频中的几个静止帧合并到一个图像中可以得到最好的整体图像 - 但是,用于此的技术是由第三方开发的,他们不想发布它,我'我害怕 :(

祝你好运!

于 2012-11-07T12:56:01.293 回答