我正在使用 win 表单 C# 应用程序。应用程序从视频设备(如电视/相机或输入视频文件)中获取图像。然后对其进行处理并将其保存在文本文档中。
我的问题是,“如何创建数字视频 OCR?”
请建议我任何教程/链接/源代码。
我正在使用 win 表单 C# 应用程序。应用程序从视频设备(如电视/相机或输入视频文件)中获取图像。然后对其进行处理并将其保存在文本文档中。
我的问题是,“如何创建数字视频 OCR?”
请建议我任何教程/链接/源代码。
Google Cloud 提供视频 OCR API。https://cloud.google.com/video-intelligence/docs/text-detection
您可以直接使用您的视频调用此 API。它将返回文本边界框以及与您的视频相关联的时间戳。
从OCR 部分的tesseract-ocr .net 引擎和相机方法的Emgu CV开始。祝你好运。
由于视频 OCR 仍然是一个活跃的研究课题,您可能需要付出更多的努力来开发自己的视频 OCR 引擎。基本上,可以基于视频场景剪辑检测、文本检测和视频剪辑识别来构建视频 OCR 框架。
使用场景剪辑检测作为预处理步骤以降低计算成本;然后定位视频剪辑帧中文本内容的位置和边界;通过使用适当的文本分割和二值化技术从背景中分离文本像素。最后可以应用打印 OCR 引擎来获得文本结果。
如果只是处理少量视频数据,可以使用mashape上免费的视频OCR rest API。
以前的一些工作可能是相关的:
如果您或其他任何人正在为此工作,我发现这个网站非常有帮助。
基本上,将视频转换为静止图像,对这些图像进行处理以优化 OCR 结果,然后对每个图像进行 OCR 处理。