问题标签 [glmnet]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5171 浏览

r - glmnet 套索 ROC 图表

我在glmnet(实现套索回归)中使用了 k 折交叉验证,但我无法从中制作 ROC 图表。

这让我得到了一个看起来像拟合值对数的向量。在此之后我试图生成一些 ROC 图表,但它没有工作。我认为这是因为 x 和 y 对象的性质进入glmnet. 你有什么想法。

0 投票
2 回答
10592 浏览

r - 为什么不建议从 glmnet 模型中获取回归系数的统计摘要信息?

我有一个二元结果的回归模型。我用 glmnet 拟合了模型并得到了选定的变量及其系数。

由于 glmnet 不计算变量的重要性,我想将确切的输出(选定的变量及其系数)提供给 glm 以获取信息(标准错误等)。

我搜索了 r 文档,看来我可以使用 glm 中的“方法”选项来指定用户定义的函数。但是我没有这样做,有人可以帮助我吗?

0 投票
1 回答
231 浏览

r - 如何使用 glmnet 模型作为 mob 功能的节点模型(R 包方)?

我正在使用mobR 包的功能party。我的问题是model关于这个函数的参数。

我如何定义一个 StatModel 对象(来自包modeltools) - 我们称之为glmnetModel - 以便mob估计的节点模型是glmnet模型(更准确地说,我想将该cv.glmnet函数用作glmnetModelfit插槽中的主要估计函数)?

一个困难是正确地扩展reweight函数(可能还有estfunanddeviance函数?),就像这里建议的那样(第 2.1 节)。

有人有想法吗?

注意:我已经看到了一些扩展(对于 SVM:here),但我无法正确使用它们。

非常感谢 !

多米尼克

0 投票
2 回答
364 浏览

r - R中的GLMNET项目响应理论

我正在尝试使用惩罚回归来拟合 2 参数项目响应模型,作为我正在从事的项目的一部分。为此,我一直在尝试使用 R 中的 glmnet 包。这样做的问题是 glmnet 想要将参数惩罚为零。相反,我想对斜率参数进行惩罚,使其因远离一个而受到惩罚(对于那些熟悉 IRT 的人,我试图让数据来指导是否需要估计辨别参数)。有没有办法在 glmnet 中做到这一点?

可以在此处找到类似的应用程序。

0 投票
1 回答
6901 浏览

r - 在 glmnet 中估计许多交互项

我的理解是 glmnet 采用矩阵,其中每列都是解释变量。

我有一个包含约 10 个解释变量的数据框(其中一些是因子)

我如何使用 y~(x1*x2*x3)+(x4*x5)+x6 之类的公式并使用 glmnet 进行估计?

我相信我必须创建一个矩阵,其中每个交互项都有自己的列,但我不知道如何简单地将公式和变量(其中一些是因子)输入并得到一个我可以轻松放入的矩阵网络。

0 投票
2 回答
10713 浏览

r - 运行 glmnet() 的大矩阵

我在运行具有广泛数据集的 glmnet lasso 时遇到问题。我的数据有 N=50,但 p > 49000,所有因素。因此,要运行 glmnet,我必须创建一个 model.matrix,但是当我调用 model.matrix(formula, data) 时,我的内存不足,其中 formula = Class ~ 。

作为一个工作示例,我将生成一个数据集:

之后,我尝试创建一个 model.matrix 以在 glmnet 上输入。

在最后一步(X = model.matrix ...)我内存不足。我能做些什么?

0 投票
1 回答
1631 浏览

r - R 插入符号 glmnet 标准化 = FALSE

我正在尝试使用该caret软件包来玩模型的alpha关卡glmnet。问题是我使用的数据都是虚拟变量,我不想glmnet标准化它们。通常,如果我只是使用glmnet或单独使用cv.glmnet,我会添加

是否有caret关闭标准化的设置?

0 投票
2 回答
7978 浏览

r - glmnet 的标准化参数如何处理虚拟变量?

在我的数据集中,我有许多连续变量和虚拟变量。对于使用 glmnet 的分析,我希望对连续变量进行标准化,而不是对虚拟变量进行标准化。

我目前通过首先定义一个只有 [0,1] 值的列的虚拟向量然后scale在所有非虚拟列上使用该命令来手动执行此操作。问题是,这不是很优雅。

但是 glmnet 有一个内置的standardize参数。默认情况下,这也会标准化假人吗?如果是这样,是否有一种优雅的方式来告诉 glmnet 的standardize论点跳过假人?

0 投票
2 回答
12272 浏览

r - Plotting an ROC curve in glmnet

EDIT: As Dwin pointed out in the comments, the code below is not for an ROC curve. An ROC curve must be indexed in variation in t and not in lambda (as I do below). I will edit the code below when I get the chance.

Below is my attempt to create an ROC curve of glmnet predicting a binary outcome. I've simulated a matrix that approximates glmnet results in the code below. As some of you know, given an n x p matrix of inputs, glmnet outputs an n x 100 matrix of predicted probabilities [$\Pr(y_i = 1)$] for 100 different values of lambda. The output will be narrower than 100 if further changes in lambda stop increasing predictive power. The simulated matrix of glmnet predicted probabilities below is a 250x69 matrix.

First, is there an easier way to plot a glmnet ROC curve? Second, if not, does the below approach seem correct? Third, do I care about plotting (1) the probability of false/true positives OR (2) simply the observed rate of false/true positives?

There's one question on this on SO, but the answer was rough and not quite right: glmnet lasso ROC charts

0 投票
1 回答
5000 浏览

r - 如何在 R 中使用留一法交叉验证获得 AUC?

我有一个包含 100 个样本(行)和 10000 个独立特征(列)的矩阵 (x)。观察结果是二元的,样本是好的还是坏的 {0,1}(存储在向量 y 中)。我想执行遗漏交叉验证并分别确定每个功能的曲线下面积(AUC)(类似于 CAtools 包中的 colAUC)。我尝试使用 glmnet,但它不起作用。正如手册中所说,我尝试将 nfold 参数设置为等于观察次数(100)。

我收到了这些警告:

任何想法我做错了什么?是否有任何其他方式或 R 包来获得每个特征的 LOO 平衡 AUC 值?

我会非常感谢任何帮助。谢谢!