我需要一个可以检测图像中对象的库(使用边缘检测)。这与验证码无关。我正在开发一个使用 OCR 并且可以在任何屏幕分辨率下工作的 MTGO 机器人。为了将它移植到任何屏幕分辨率,我的想法是在结果页面上扫描狭窄的范围(玩家拥有的卡片可以在文本行中列出)并找到该范围内的每个对象。然后取每个对象的最低和最高像素坐标来查找行的开始和结束位置(在 y 轴上),以便我可以使用 OCR 读取每一行。
6 回答
它并不便宜,但我使用了 Intel Processing Primitives,并且对它们的性能印象深刻。它们适用于 Intel 和 AMD 处理器,以及 Windows 和 Linux
也许这会很有用:
Simd Library是一个免费的开源图像处理库,专为 C 和 C++ 程序员设计。它为图像处理提供了许多有用的高性能算法,例如:像素格式转换、图像缩放和过滤、从图像中提取统计信息、运动检测。通过使用不同的 SIMD CPU 扩展对算法进行了优化。特别是该库支持以下 CPU 扩展:SSE、SSE2、SSSE3、SSE4.1、SSE4.2、AVX 和 AVX2 用于 x86/x64,VMX(Altivec) 和 VSX(Power7) 用于 PowerPC,NEON 用于 ARM。Simd 库具有 C API,还包含有用的 C++ 类和函数,以方便访问 C API。该库支持动态和静态链接、32 位和 64 位 Windows 和 Linux、MSVS 和 G++ 编译器、MSVS 项目和 CMake 构建系统。
看过Lead 工具成像 SDK吗?不是免费的,但是很全面。
正方体 ocr ? (阿帕奇许可证 2.0)
Framewave 基于AMD 性能库,提供图像处理功能。还检查相关的快速跨平台 C/C++ 图像处理库