许多论文提到,在图像被划分为 mxm 矩阵块之后,文本区域会产生从灰度像素值计算的高特征值。此外,特征值是图像纹理“粗糙度”的度量。
这与获取文本有什么关系?文本区域一般有背景和前景两种颜色,笔划颜色统一。这种粗糙度在哪里 - 可能有许多其他特征会更粗糙并触发高特征值。有人能指出从哪里得到连接这些东西的数学吗?
编辑: 一些论文包括在自然场景中的文本检测上下文中提到特征值。
一个实时检测和跟踪文本的框架使用灰度图像上的特征变换。
一种基于特征值的视频文本检测方法提到从梯度图像的协方差矩阵计算特征值。