我是 R 和 SVM 的新手,我正在尝试svm
从e1071
包中分析功能。但是,我找不到任何大型数据集可以让我获得不同输入数据大小的良好结果分析范围。有谁知道怎么锻炼svm
?我应该使用哪个数据集?任何特定的参数svm
使它更努力地工作?
我复制了一些我用来测试性能的命令。也许在这里得到我正在尝试的东西是最有用和更容易的:
#loading libraries
library(class)
library(e1071)
#I've been using golubEsets (more examples availables)
library(golubEsets)
#get the data: matrix 7129x38
data(Golub_Train)
n <- exprs(Golub_Train)
#duplicate rows(to make the dataset larger)
n<-rbind(n,n)
#take training samples as a vector
samplelabels <- as.vector(Golub_Train@phenoData@data$ALL.AML)
#calculate svm and profile it
Rprof('svm.out')
svmmodel1 <- svm(x=t(n), y=samplelabels, type='C', kernel="radial", cross=10)
Rprof(NULL)
我不断增加重复行和列的数据集,但我达到了内存的限制,而不是让svm
工作更加努力......