我有一个名为“training_data”的列表。“training_data”列表包含使用以下函数从多个文件中读取的数据。
training_data <- lapply(files, read.table, header=TRUE, sep=",")
我可以使用以下命令访问任何数据集的第一个字段:
training_data[[1]][1] # The first field contains the class "pos OR neg"
我必须使用支持向量机 (e1071) 使用这些数据集(包含在 training_data 中)进行二进制分类。但问题是某些数据集仅包含一个类的数据,即全部 pos 或全部 neg,这对于 svm 函数是不可接受的,我想排除这些数据集。我尝试了以下代码,但无法访问类列。
training_data<-lapply(training_data,
function(data)
{
if(["the class field is always positive"])
### exclude this dataset from training_data
})
更新:我如何才能访问传递给函数的第一列数据?以及如何从 training_data 中排除那些仅在类列中包含一个类的数据集?
谢谢