-2

我只是从数据挖掘技术开始,熟悉一些数据文件格式。我先看看 *.ARFF,现在看看 *.LIBSVM。
你能告诉我行首的第一个数字是什么吗?我能理解 ARFF 术语中的那个数字吗

+1 1:70.000000 2:1.000000 3:4.000000 4:130.000000 5:322.000000 6:0.000000 7:2.000000 8:109.000000 9:0.000000 10:2.400000 11:2.000000 12:3.000000 13:3.000000 
-1 1:67.000000 2:0.000000 3:3.000000 4:115.000000 5:564.000000 6:0.000000 7:2.000000 8:160.000000 9:0.000000 10:1.600000 11:2.000000 12:0.000000 13:7.000000 
+1 1:57.000000 2:1.000000 3:2.000000 4:124.000000 5:261.000000 6:0.000000 7:0.000000 8:141.000000 9:0.000000 10:0.300000 11:1.000000 12:0.000000 13:7.000000 
-1 1:64.000000 2:1.000000 3:4.000000 4:128.000000 5:263.000000 6:0.000000 7:0.000000 8:105.000000 9:1.000000 10:0.200000 11:2.000000 12:1.000000 13:7.000000 
-1 1:74.000000 2:0.000000 3:2.000000 4:120.000000 5:269.000000 6:0.000000 7:2.000000 8:121.000000 9:1.000000 10:0.200000 11:1.000000 12:1.000000 13:3.000000 
-1 1:65.000000 2:1.000000 3:4.000000 4:120.000000 5:177.000000 6:0.000000 7:0.000000 8:140.000000 9:0.000000 10:0.400000 11:1.000000 12:0.000000 13:7.000000 

为什么我在http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/中看到很多 +1 和 -1 重复

4

2 回答 2

1

第一个数字是类标签。

于 2013-11-01T18:41:07.973 回答
0

支持向量机使用支持向量来表示正类和负类。

第一列最有可能给正例+1,负例-1。这就是为什么除了这两个之外没有其他价值......

您可能需要阅读 libsvm 的文档:

使用 LIBSVM 的说明在主目录和一些子目录的 README 文件中。主目录中的 README:详细说明所有选项、数据格式和库调用。tools/README:参数选择等工具

于 2013-11-02T14:48:26.677 回答