9

我正在使用 OpenCV 中的 letter_regcog 示例,它使用了来自 UCI 的数据集,其结构如下:

属性信息:
     1.lettr大写字母(从A到Z的26个值)
     2. x-box box的水平位置(整数)
     3. box的y-box垂直位置(整数)
     4.宽度宽度框(整数)
     5.盒子高度(整数)
     6. onpix total # on像素(整数)
     7. x-bar mean x of on pixel in box (integer)
     8. y-bar mean y of on pixels in box (integer)
     9. x2bar 均值 x 方差(整数)
    10. y2bar 均值 y 方差(整数)
    11. xybar 均值 xy 相关性(整数)
    12. x2ybr x * x * y 的平均值(整数)
    13. xy2br x * y * y 的平均值(整数)
    14. x-ege 从左到右的平均边数(整数)
    15. x-ege 与 y 的 xegvy 相关性(整数)
    16. y-ege mean edge count bottom to top(整数)
    17. y-ege 与 x 的 yegvx 相关性(整数)

例子:

T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10

现在我已经分割了字母的图像,并希望将其转换为这样的数据以识别它,但我不明白所有值的平均值,如“6. onpix total # on pixel”是什么意思?你能解释一下这些值的平均值吗?谢谢。

4

2 回答 2

5

我不熟悉 OpenCV 的 letter_recog 示例,但这似乎是一个特征向量,或一组关于用于对未来出现的字母进行分类的字母图像的统计数据。分割的结果应该给你留下一个二进制掩码,字母上是 1,其他地方都是 0。onpix 只是落在字母上的像素总数,或者换句话说,是二进制掩码的总和。

列表中的大多数其余值都需要根据二进制掩码中值为 1 的像素集进行计算。x 和 y 只是像素的位置。例如,x-bar 只是掩码中所有像素为 1 的所有 x 位置的样本平均值。您应该能够轻松地在网络上找到有关均值、方差、协方差和相关性的数学定义的参考资料。

14-17 有点不同,因为它们是基于边缘像素的,但计算应该是相似的,只是在一组不同的像素上。

于 2009-08-13T13:15:20.310 回答
4

我的名字是安东尼奥·伯纳尔。在本文的第 3 页中,您将找到每个值的良好描述。 使用荷兰式自适应分类器的字母识别

如果您有任何疑问,请告诉我。我试图让这个算法工作,但我的问题是我不知道如何缩放这些值以适应它们的范围 0-15。你知道怎么做吗?

Google 学者的另一个链接 ->使用荷兰式自适应分类器的字母识别

于 2009-08-26T11:23:57.480 回答