2

最近看了很多斯坦福搞笑的公开课视频讲座。特别是关于无监督机器学习的部分引起了我的注意。不幸的是,如果它可能变得更有趣,它就会停止。

基本上,我希望通过无监督算法对离散矩阵进行分类。这些矩阵只包含相同范围的离散值。假设我有 1000 个 20x15 矩阵,其值范围为 1-3。我刚开始阅读文献,我觉得图像分类要复杂得多(颜色直方图),而且我的案例只是对那里所做的事情的简化。

我还查看了机器学习集群Cran 任务视图,但不知道从哪里开始使用实际示例。

所以我的问题是:哪个包/算法是开始在 R 中解决问题的好选择?

编辑:我意识到我可能不精确:我的矩阵包含离散选择数据——所以意味着聚类可能(!)不是正确的想法。我确实理解你所说的关于向量和观察的内容,但我希望有一些函数可以接受矩阵或 data.frames,因为随着时间的推移我有几个观察结果。

EDIT2:我意识到专注于分类数据的无监督分类的包/功能介绍是现在对我最有帮助的。

4

3 回答 3

0

到目前为止,我分别daisycluster包中找到了参数“gower”,它指的是Gower's similarity coefficient处理多种数据模式。Gower 似乎是一个相当唯一的距离度量,但它仍然是我发现用于分类数据的。

于 2011-10-28T20:19:01.207 回答
0

...通过无监督算法对离散矩阵进行分类

您必须是指将它们聚集在一起。分类通常由监督算法完成。

我觉得图像分类要复杂得多(颜色直方图),而且我的情况是对那里所做的事情的简化

如果不知道你的矩阵代表什么,很难说出你需要什么样的算法。但一个起点可能是展平您的 20*15 矩阵以生成长度为 300 的向量;这样一个向量的每个元素都将是一个特征(或变量),以作为聚类的基础。这是 ML 包(包括Cluster您链接到的包)必须工作的方式:“在矩阵或数据框的情况下,每一行对应一个观察值,每一列对应一个变量。”

于 2011-10-27T21:25:43.907 回答
-1

您可能想从这里开始:http ://cran.r-project.org/web/views/MachineLearning.html

于 2011-10-27T21:34:33.630 回答