1

我正在读一本关于大脑如何使用模式层次结构来识别和建模概念和感觉信息的书,比如写在书中的字母和单词,或物理对象,或其他类似性质的事物。但我对如何实施这样一个系统的简单版本感到有点困惑。我对此有几个问题。

  • 首先,在这种情况下,模式的所有特征到底是什么?
  • 在这种模式层次结构中,最基本的元素是什么?
  • 有没有办法通过算法而不是神经网络来识别它们?
  • 如果我编写一个程序来从一行像素中形成图案,这可能有点容易,但是我将如何使用二维像素数组来做到这一点?
  • 视觉模式和数学模式之间有区别吗?
  • 与图像中的特征序列相比,人们识别数字序列中的模式的方式有什么不同吗?

我真的很想得到一些帮助来理解这一点,因为我发现的大部分信息都需要我到目前为止还没有获得的出色的数学背景。

4

1 回答 1

1

数学模式和图像特征的识别都使用相同类型的“认知”,但您有各种不同的实现,专门针对每一个。在图像中,您正在处理像素颜色(例如:255,255,255)及其与周围像素的关系(二维数组)。

为了便于计算,大多数算法都经过以下步骤:

  • 遍历每条水平线,然后遍历每条垂直线并创建一个像素差异数组(最好在 L*a*b 颜色空间中)。
  • 然后通过调整一些参数,您可以隔离在 x 和 y 方向上连续的独特“对象”
  • 创建对象的逻辑树及其在图像上的位置

如果您想做一些不同的事情,那么您将使用快速傅立叶变换并遵循那里的模式。如果您使用常规数字模式,则原理是相同的。

于 2013-03-31T18:32:59.553 回答