1

使用penalizedSVMR 包,我正在尝试进行特征选择。有一个名为 trainingdata 的几个 data.frames 的列表。

trainingdata <-lapply(trainingdata, function(data)
                   {
                     levels(data$label) <- c(-1, 1)
                     train_x<-data[, -1]
                     train_x<-data.matrix(train_x)
                     trainy<-data[, 1]
                     print(which(!is.finite(train_x)))
                     scad.fix<-svm.fs(train_x, y=trainy, fs.method="scad",
                                      cross.outer=0, grid.search="discrete",
                                      lambda1.set=lambda1.scad, parms.coding="none",
                                      show="none", maxIter=1000, inner.val.method="cv",
                                      cross.inner=5, seed=seed, verbose=FALSE)

                     data <- data[c(1, scad.fix$model$xind)]
                     data
                   })

一些迭代进展顺利,但在一个 data.frame 上我收到以下错误消息。

[1] "feature selection method is scad"
Error in svd(m, nv = 0, nu = 0) : infinite or missing values in 'x'
Calls: lapply ... scadsvc -> .calc.mult.inv_Q_mat2 -> rank.condition -> svd

使用以下调用,我还检查 x 是否真的是无限的,但调用返回 0 为所有前面和当前发生错误的 data.frame。

print(which(!is.finite(train_x)))

有没有其他方法可以检查无限值?还有什么办法可以纠正这个错误?有什么方法可以确定在 lapply 中处理的当前 data.frame 的索引吗?

4

1 回答 1

1

对于第一个问题,infinite or missing values in 'x' 建议您将条件更改为 .

   idx <- is.na(train_x) | is.infinite(train_x)

例如,您可以将 0 分配给这些值。

   train_x[idx] <- 0

对于第二个问题,关于如何获取当前 data.frame 的名称, lapply您可以遍历 data.farmes 的名称,并执行以下操作:

 lapply(names(trainingdata), function(data){ data <- trainingdata[data]....}

例如:

 ll <- list(f=1,c=2)
> lapply(names(list(f=1,c=2)), function(x) data <- ll[x])
[[1]]
[[1]]$f
[1] 1


[[2]]
[[2]]$c
[1] 2

编辑

您可以tryCatch在此行之前使用 scad.fix<-svm.fs

   tryCatch(
    scad.fix<-svm.fs(....)
      , error = function(e) e)
           })

例如,这里我在这个列表上测试它,代码继续执行到列表的末尾,即使列表中有一个 NA。

lapply(list(1,NA,2), function(x){
  tryCatch(
  if (any(!is.finite(x)))
     stop("infinite or missing values in 'x'")
  , error = function(e) e)
       })
于 2013-02-23T17:01:33.170 回答