1

我正在为我的机器学习 (ML) 课程学习,但我有一个问题,我无法用我目前的知识找到答案。假设我有以下数据集,

att1 att2 att3 class
5    6    10   a
2    1    5    b
47   8    4    c
4    9    8    a
4    5    6    b

上面的数据集很清楚,我想我可以在训练我的数据集后对新传入的数据应用分类算法。由于每个实例都有一个标签,因此很容易理解每​​个实例都有一个带有标签的类。现在,我的问题是,如果我们有一个由不同实例(例如手势识别数据)组成的类会怎样。任何类都会有多个指定其类的实例。例如,

xcor ycord depth 
45   100   10
50   20    45
10   51    12

以上三个实例属于A类,下面三个实例属于B类,我的意思是这三个数据实例共同构成了该类。对于手势数据,您的手的移动坐标。

xcor ycord depth 
45   100   10
50   20    45
10   51    12

现在,我希望将每个传入的三个实例分组为 A 或 B?是否可以在不单独标记每个实例的情况下将所有这些标记为 A 或 B?例如,假设以下组属于 B,所以我希望所有实例一起标记为 B,而不是单独标记为 B,因为它们与 A 类或 B 类的独立相似性?如果可能,我们怎么称呼它?

xcor ycord depth 
45   10    10
5    20    87
10   51    44
4

3 回答 3

2

您似乎对不同类型的机器学习感到困惑。

课堂上给出的数据集是监督分类算法的一个例子。也就是说,给定一些数据和一些类,学习一个分类器,该分类器可以预测新的、看不见的数据的类。您可以应用于此问题的分类器包括

您描述的第二个问题是无监督分类问题的示例。也就是说,给定一些没有标签的数据,我们希望找到一种自动方法来通过算法分离不同类型的数据(您的 A 和 B)。解决这个问题的算法包括

我会考虑运行因子分析或规范化您的数据,然后运行 ​​K-means 或高斯混合模型。如果它们是可区分的,这应该会发现您的数据的 A 和 B 类型。

于 2013-03-08T04:31:55.700 回答
2

我没有看到您可能希望将数据集中不确定数量的行分组为给定类的特征的场景。它们要么与一个类独立关联,要么都是特征,因此是唯一的行。就像是:

Instead of
xcor ycord depth 
45   10    10
5    20    87
10   51    44

会是这样的:

xcor1 ycord1 depth1 xcor2 ycord2 depth2 xcor3 ycord3 depth3  
45      10    10      5    20     87     10     51    44

这与用于建模时间序列的方法几乎相同

于 2013-03-08T11:51:41.213 回答
1

看看使用神经网络识别手写文本。您可以将手势视为带有额外时间组件的手写图形(因此,给每个像素一个“年龄”。)如果您的训练数据也包含类似的时间数据,那么我认为该技术应该很好地延续。

于 2013-03-08T03:58:52.783 回答