17

我正在尝试使用 glmnet 创建一个模型(当前使用 cv 来查找 lambda 值),但出现错误NA/NaN/Inf in foreign function call (arg 5)。我相信这与我的数据集中的 NA 值有关,因为当我使用 NA 删除所有数据点时,命令会成功运行。

我的印象是 glmnet可以处理 NA 值。我不确定错误来自哪里:

> res <- cv.glmnet(features.mat, as.factor(tmp[,"outcome"]), family="binomial")
Error in lognet(x, is.sparse, ix, jx, y, weights, offset, alpha, nobs,  : 
  NA/NaN/Inf in foreign function call (arg 5)

数据集如下所示:

> head(features.mat)
6 x 8 sparse Matrix of class "dgCMatrix"
   a b   c  e  f  g  h i
1  1 1 138 NA NA 15 NA .
4  1 3 171 NA NA 17 NA .
7  1 1 156 NA NA  5 NA .
8  1 4  97 NA NA  7 NA .
9  1 1 219 NA NA 11 NA .
10 1 . 263 NA NA 20 NA .
> head(as.factor(tmp[,"outcome"]))
[1] 0 0 0 0 0 0
Levels: 0 1
4

4 回答 4

17

看来 glmnet 无法处理 NA 值!

于 2014-02-18T20:26:21.523 回答
17

另外:如果您在数据框中没有 NA 的情况下出现此错误,您可能还没有使用 model.matrix 函数定义输入矩阵。

x <- model.matrix( ~ ., Data)

我知道这不是您问题的答案,但我遇到了与您相同的错误并找到了此解决方案。所以它可能对其他人有帮助。

于 2018-12-09T13:58:24.170 回答
1

请注意,如果您包含日期功能,也会发生这种情况。我没有 NA,但得到了这个错误。当我删除日期变量时,一切都很好。

于 2021-04-15T22:42:44.253 回答
1

如上所述,cv.glmnet 不支持转换为因子的字符数据类型,无法处理 NA。使用 as.numeric 或 as.double。

于 2020-11-19T18:10:01.240 回答