1

阅读一篇论文,我很难理解所描述的算法:

给定手写样本的黑白数字图像,剪下一个字符进行分析。由于这可以是任意大小,因此算法需要考虑到这一点(如果更容易,我们可以假设大小为 2^nx 2^m)。

现在,给定此图像的描述状态,我们将其转换为 512 位特征(512 位哈希),如下所示:

  1. (192 位)通过将图像与 3x3 Sobel 算子进行卷积来计算图像的梯度。每个边缘的梯度方向被量化为 12 个方向。

  2. (192 位)结构特征生成器获取梯度图并在邻域中查找梯度值的某些组合。(用于计算代表图像中线和角的 8 个不同特征)

  3. (128 位)凹度生成器使用 8 点星形算子来查找 4 个方向、孔和大型笔划上的粗凹度。

图像特征图使用 4x4 网格进行归一化。

我现在正在努力解决如何拍摄任意图像,分成 16 个部分,并使用 3x3 Sobel 运算符为每个部分提供 12 位。(但如果您对其他部分有所了解,请随时发表评论:)

4

2 回答 2

3

我正在为 Srihari 等人的同一篇论文而苦苦挣扎。(2002)为我的博士学位。论文。我想说这篇文章不是很具体,但作者参考了一份技术报告 (CEDAR-TR-01-1) 了解更多详细信息。这份报告似乎无法在互联网上访问,所以我的建议是通过电子邮件联系作者并索取这份报告。如果有不清楚的地方,您也可以要求澄清。

于 2009-11-03T11:56:01.390 回答
2

我看到这个问题很老了,但也许它可以帮助别人——你应用 sobel 算子在图像上进行水平和垂直边缘检测。根据结果​​,您可以计算图像每个点的图像方向向量。在您的情况下,您需要将这些向量映射到 12 个方向。然后,在您的情况下,您将图像划分为 4x4 子图像(16 个部分)并计算每个部分中每个方向的强度。这为您提供了 12*16=192 个特征。如果需要,我可以给出更详细的解释。

于 2014-07-18T12:45:50.907 回答