问题标签 [glmnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
7924 浏览

r - 如何在 glmnet 和交叉验证中自动选择变量

我正在学习glmnetbrnn包的使用。考虑以下代码:

上面的脚本运行正常。

我的问题是:如何自动化上述脚本以针对不同的值运行locn,这本质上是我如何概括获得步骤:cols <- c(1, 3, 6, 8, 11, 20, 25, 38) # column indices of useful iv's。目前我可以手动执行此操作,但看不到如何针对不同的值以一般方式执行此操作locn,例如

0 投票
1 回答
6482 浏览

r - 我可以对具有不同数量预测变量的测试数据执行 predict.glmnet 吗?

我使用 glmnet 在具有约 200 个预测变量和 100 个样本的训练集上构建了一个预测模型,用于二项式回归/分类问题。

我选择了给我最大 AUC 的最佳模型(16 个预测变量)。我有一个独立的测试集,只有那些变量(16 个预测变量)从训练集中进入最终模型。

有什么方法可以使用基于来自训练集的最佳模型的 predict.glmnet 和新的测试集,其中只有那些变量的数据,这些变量从训练集中进入最终模型?

0 投票
3 回答
1056 浏览

r - R: GLMNET odd behavior when model is reran

I am trying to use LASSO for variable selection, and attempted the implementation in R using the glmnet package. This is the code I wrote so far:

This is what I obtain when I run it the first time:

BUT, this is what I obtain when I run the SAME code once more:

I am not sure why the model behaves this way. How would I be able to choose a final model if the coefficients change at every run? Does it use a different tuning parameter $\lambda$ at every run? I thought that cv.glmnet uses model$lambda.1se by default?!

I have just started learning about this package, and would appreciate any help I can get!

Thank you!

0 投票
1 回答
977 浏览

r - 使用 glmnet 获取系数的 z 分数

我正在使用该glmnet包来获取 LASSO 估计值,如下所示:

我可以使用 提取系数coef(model),但是,我想不出一种方法来获取每个变量的标准误差Z 分数

0 投票
0 回答
2236 浏览

r - R 中机器学习的最新包:套索、随机森林、神经网络

我正在与社区联系,以了解在 R 中实现 Lasso、RF 和 NN 的最新软件包。

套索

据我所知,lars已经被glmnetfor lasso 和 ridge 回归所取代。我认为glmnet是最前沿的包。http://cran.r-project.org/web/packages/glmnet/index.html

随机森林

到目前为止,我使用了 Breiman 和 Cutler 的包randomforest. http://cran.r-project.org/web/packages/randomForest/index.html

我相信有一个名为partyHothorn、Hornik、Strobl 和 Zeileis 的新软件包,其中cforest()实现了 Breiman 的随机森林。我还没用过。http://cran.r-project.org/web/packages/party/index.html

神经网络

对于神经网络,Guenther 的neuralnet包刚刚于 2013 年 8 月 29 日发布。虽然我没有用它来谈论它目前是否被认为是 NN 的最佳选择。 http://cran.r-project.org/web/packages/neuralnet/neuralnet.pdf

0 投票
0 回答
668 浏览

r - R,gl​​mnet:无法在 cv.glmnet 中产生可复制的结果——set.seed 不这样做

每次我运行时,cv.glmnet我都会得到稍微不同的结果(例如,模型选择的最佳 lambda)。不像大多数功能,set.seed()不能解决问题。有谁知道问题的原因或解决方案?

0 投票
2 回答
6124 浏览

r - 如何在 R 中使用 glmnet 解决分类问题

我想使用 R 中的 glmnet 来解决分类问题。

样本数据如下:

y 是二元响应(0 或 1)。

我使用了以下 R 代码:

然而,glmnet 预测的 yy 分散在 [-24,5] 之间。

如何将输出值限制为 [0,1],从而使用它来解决分类问题?

0 投票
1 回答
312 浏览

r - 插入符号:开关错误(tolower(trControl$method),oob = NULL,alt_cv = ,cv = createFolds(y,

我正在使用caret包来调整模型alphalambda参数glmnet。我的特征在X(数据框,14474 个变量中的 47 个 obs,一个 p>>N 问题),因变量y是一个 47 个 obs 的数据框。1 个变量。

当我尝试

我明白了

我试过转置y,也改成class(y) = "numeric",而不是,"data.frame"但我得到了同样的错误,我不明白。有什么线索吗?

0 投票
2 回答
3632 浏览

r - 当 family="poisson" 的 lambda=0 时,glmnet 缺乏收敛性

在处理 glmnet 与 glm 时,我遇到了 lambda=0 和 family="poisson" 的收敛问题。我的理解是,对于 lambda=0(和 alpha=1,默认值),答案应该基本相同。

下面的代码与 glmnet 帮助页面 (?glmnet) 上的泊松示例略有不同。唯一的变化是 nzc = p 以便所有变量都在真实模型中

这是错误消息

更新:问题似乎与当 family="poisson" 时 glmnet 估计的截距有关,并且与 lambda 本身的设置无关。

0 投票
1 回答
3683 浏览

r - 使用 glm.fit、bigglm、speedglm、glmnet、LiblineaR 对逻辑回归进行基准测试

我正在模拟数据并比较二元 logit 模型的 glm.fit、bigglm、speedglm、glmnet、LiblineaR。

示例运行如下所示:

我经常看到来自 LiblineaR 的估计值很接近,但迹象却相反!有人知道为什么会这样吗?它通常是最快的,并且在我见过的更大数据集的情况下甚至更快。

我知道由于正则化,这些值不会相同;我对这些迹象更好奇。

如果有人(rep>1500)可以请添加#LiblineaR 和#speedglm 标签,我将不胜感激。