我正在尝试构建一个人工智能单元。我计划首先将感官输入(“观察”)收集到一个短期工作记忆列表中,不断形成在这个列表中找到的模式(“想法”),然后将这些想法提交到一个长期存储记忆中它们达到了相当大的规模,可能是七个连锁观察。对于任何哲学人来说,类似于洛克的人类理解论文,但这不会是白板。需要有一个编码的底层结构。
因此,我的问题是:
是否有/在哪里有一个很好的算法来动态合并或“模式化”这个不断增长的观察字符串的最大子字符串?例如:如果到目前为止给了我 ABCDABCABC,我想要一个 ABC 想法,D 和另外两个 ABC 想法;然后,如果观察到另一个 D 并将其添加到短期记忆中,我想要一个 ABCD 令牌、一个 ABC 令牌和另一个 ABCD 令牌。我不想使用 Shortest Common Substring,因为我需要在添加任意数量的字符后重新运行它。我想我更喜欢一些易于搜索/可修改的树结构。
这看起来像一个足够体面的解决方案吗? http://www.cs.ucsb.edu/~foschini/files/licenza_spec_thesis.pdf。如果不出意外,我认为其他数据挖掘者可能会喜欢。