我是机器学习的新手。在阅读有关监督学习、无监督学习、强化学习的信息时,我遇到了以下问题并感到困惑。请帮助我在以下三个中确定哪一个是监督学习,无监督学习,强化学习。
什么类型的学习(如果有的话)最能描述以下三个场景:
(i) 为自动售货机创建硬币分类系统。为了做到这一点,开发人员从美国造币厂获得准确的硬币规格,并得出尺寸、重量和面额的统计模型,然后自动售货机使用该模型对其硬币进行分类。
(ii) 不是调用美国造币厂来获取硬币信息,而是提供一种算法,其中包含大量标记的硬币。该算法使用这些数据来推断自动售货机用来对其硬币进行分类的决策边界。
(iii) 计算机通过反复下棋并通过惩罚最终导致失败的动作来调整其策略来制定玩井字游戏的策略。