我有一个 2 类数据集,我应该在其上应用二进制分类算法。数据集如下所示:
a1,a2,a3,……+1
……
b1,b2,b3,…………-1
…………
其中每个特征/属性值都是一个 2 元组。例如,a1 是 (a1_1, a1_2)。a1_1 和 a1_2 之间存在依赖关系(尽管此时我不确定它们是如何相关的)并且它们的顺序并不重要。类似的情况也适用于负类实例。
我正在寻找对这些实例进行分类的某种方法。请让我知道是否存在这样的算法。
首先,我尝试拆分元组 - a1_1 和 a1_2 为一个实例形成两个单独的列,导致每个实例的特征值数量增加一倍 - 并使用 LIBSVM (C/C++) 库,但结果并不好。我认为拆分元组并因此寻找合适的方法是没有意义的。