假设我有文本表的灰度照片。每张纸都是白色的,文本是黑色的。
不幸的是,光线不均匀,还会出现透视阴影,纸张也可能弯曲。当然,图像上有一些小的高频噪声。
我确信在这种情况下应该有几乎理想的解决方案来分离文本和背景。
那是什么?:)
我不相信将这样的灰度图像变成近乎完美的黑白图像是不可能的,甚至是困难的。我无法证明这一点,但我根据自己的感知来判断:我不需要任何智能就可以通过眼睛识别这些图片。它们可以是任何语言,甚至是不熟悉的语言,但我会看看到底写了什么。
那么,如何教计算机做同样的事情呢?
更新
考虑原始图像
任何全局阈值都会导致伪影 (1) 和不统一的文本表示 (2)
我需要一些阈值,它会查找本地统计数据。