我可能对此感到头疼,我可能问错了问题,但我走了。我正在寻找形成 AI 的习惯,基本上它只做一次,然后根据结果对其进行优先级排序,以便以后再做或以后避免。我的主要问题是我不确定如何存储动作。是否有任何好的、基本的、学习型 AI 或构建 AI 的指南?我为此使用python,但我只是在寻找基础知识,以便我能理解他们在做什么。
问问题
188 次
1 回答
4
您所谓的“习惯形成 AI”的传统术语是“强化学习”,其中状态和动作的估计值通过经验得到改进。Q-learning和SARSA就是典型的例子。搜索这些,您应该会找到大量书籍、示例、教程、代码示例等。
于 2013-02-28T21:46:46.830 回答