我已经扩展了我的训练数据并尝试进行交叉验证以获得最佳参数,但我不知道该怎么做。我试图读取我的缩放训练数据并将它们分配给一个svm_problem
变量:
svm_node My_svm_node[16400][157];
svm_node temp[157];
FILE *fp =NULL;
fp = fopen("Scaled_Train_Data.txt","r"); //my data is in fp
for(int LineNumber = 0 ; stop !=1 ; LineNumber++)
{
//std::cout<<"Line Number "<<LineNumber<<" Is processed .. \n";
if (readline(fp)==NULL)
{
stop = 1;
break;
}
char *p=line;
int next_index=1;
int index = 0 ;
double target;
double value;
sscanf(p,"%lf",&target);
while(isspace(*p)) ++p; //remove any spaces betweeen numbers ...
while(!isspace(*p)) ++p;
while(sscanf(p,"%d:%lf",&index,&value)==2)
{
for(i=next_index;i<index;i++)
{
temp[i-1].index = i;
temp[i-1].value = 0;
}
temp[index-1].index = index;
temp[index-1].value = value;
while(*p!=':') ++p; //check to see if we obey the rule of libsvm
++p;
while(isspace(*p)) ++p; //remove any spaces between numbers
while(*p && !isspace(*p)) ++p;
next_index=index+1;
}
temp[index].index = -1;
temp[index].value = 0;
x[LineNumber] = temp;
}
我可以向您保证,我能够成功读取数据,并且temp
变量始终包含我scaled_train
数据的一个特征向量。
但是当我打电话
svm_cross_validation(&Test_Data,¶m,7,target);
我收到运行时访问冲突错误。
我填满了
Test_data.l
= 特征向量的数量Test_data.y
= 特征标签Test_Data.x
= 特征值
我不知道这里有什么问题。
这里也有一些奇怪的东西。当我尝试读取 my 的值和索引时svm_node
,我总是得到 my 的最后一行,scaled_data
而且我无法看到整个数据。(我想问题出在这里。)
for (int j = 0 ; j < 164000 ; j++) //number of rows
{
for (int i = 0 ; i < 157 ; i++) //maximum number of features
{
printf("The x[%d][%d] is %d %lf",j,i,x[j][i].index,x[j][i].value); //I always get the last row for 16400 times !!!!!
getchar();
}
}