我正在寻找一个 Python 或 C++ 库,它将在图像中查找字符并返回这些字符的位置和边界框。如果图书馆碰巧有带有示例的文档,这是一个加号。
图书馆是否能够识别单词并不重要。
这些字符是非混淆的,并且采用简单的字体,例如 Arial。
我正在寻找一个 Python 或 C++ 库,它将在图像中查找字符并返回这些字符的位置和边界框。如果图书馆碰巧有带有示例的文档,这是一个加号。
图书馆是否能够识别单词并不重要。
这些字符是非混淆的,并且采用简单的字体,例如 Arial。
我不知道有一个标准库可以做到这一点。不过,这类任务有各种论文和示例:基本上,您需要对图像进行一些预处理以查找文本,然后确定边界框。例如,请参阅此 stackoverflow 线程以了解某些内容。
OpenCV等库可能有助于实现这一点。