Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 Tesseract,但我不知道它是否忽略了任何非文本区域并仅针对文本。我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出?
Tesseract 有一个非常好的算法来检测文本,但它最终会给出误报匹配。
理想情况下,您会在将图像提交给 tesseract 之前对其进行预处理。前段时间我搞了一个类似的任务,所以建议你看看下面的资料:
OpenCV C++/Obj-C:检测一张纸/正方形检测
执行 cv::warpPerspective 以在一组 cv::Point 上进行假偏斜
使用 cv::warpAffine 旋转 cv::Mat 偏移目标图像
仿射变换、简单旋转和缩放或其他完全?