问题标签 [lasso-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 套索回归的嵌套交叉验证代码
我对python很陌生,我的代码是对这段代码的轻微改动。目前它正在抛出以下错误(我不明白为什么):
这里的代码 - 它正在为我的数据集拟合套索,在外循环中执行模型评估,在内循环中进行模型选择(它正在为套索找到最佳 alpha 值):
r - 在 R 中使用 cv.glmnet 函数时尺寸不正确
我正在尝试使用cv.glmnet
,但出现此错误:
x[train, ] 中的错误:维数不正确。
我检查了matrix x[train, ]
y 的尺寸和长度。矩阵的列等于 y 向量的长度。
我不明白这里有什么问题。有人可以帮忙吗?
glmnet - glmnet() 如何处理惩罚和未惩罚的协变量?
是否可以用惩罚和未惩罚的协变量做一个套索模型?也就是说,我想用 进行估计Y ~ gamma * X + beta * Z
,其中 X 是受n*p
惩罚的特征,Z 是n*q
未受惩罚的连续变量或因子变量的协变量。
谢谢。
statistics - 套索回归,没有变量被丢弃
我在 R 中对二元响应变量执行套索回归。
我cv.glmnet
用来寻找最佳 lambda 并glmnet
用于检查最佳 lambda 情况的系数。在调用这两个函数时,我指定了standardize =TRUE
and alpha = 1
。
在我的案例中,我有大约 40 个变量,我确信其中一些变量与散点图和vif
(当我对相同数据执行逻辑回归时)密切相关。
我从套索回归中得到的最佳 lambda 为 <0.001,并且在最佳模型中没有任何变量被丢弃(其中 lambda = 最佳 lambda)。
想知道为什么没有删除任何变量。
lasso-regression - 如果套索等价于具有拉普拉斯先验的线性回归,那么在组件为零的集合上怎么会有质量?
我们都熟悉这个概念,在文献中有很好的记录,即套索优化(为了简单起见,这里只关注线性回归的情况)
等效于具有高斯误差的线性模型,其中参数被给定拉普拉斯先验
我们还知道,调整参数 c 设置的越高,参数设置为零的部分就越大。话虽如此,我有以下思考问题:
考虑从贝叶斯的角度来看,我们可以计算后验概率,例如,非零参数估计位于任何给定的区间集合中,并且套索设置为零的参数等于零。让我感到困惑的是,鉴于拉普拉斯先验是连续的(实际上是绝对连续的),那么在任何集合上怎么会有任何质量,它是 {0} 处的区间和单例的乘积?
matlab - 使用 LASSO 框架进行分类
我正在尝试使用 LASSO 确定我的特征在我的分类中的重要性。但是,我找不到任何这样做的参考或指南。我知道 LASSO 主要用于回归,但是,有什么方法或任何指导方针可以解决吗?
如果没有办法,有没有其他类似的方法可以让我确定我的特征的重要性?例如,哪些特征对分类影响最大?
r - R 逻辑 glmnet 惩罚因子
我正在尝试通过在 glmnet 包中使用 LASSO 来运行逻辑回归。我需要强制模型包含某些参数。但是,我得到了一个错误。
x 有 95 个变量,它们都是二进制(0 或 1)。我必须强制包含 3 个变量,所以我将它们的惩罚因子设置为 0。
如果我删除penalty.factor
,它会起作用,但我必须强制包含这三个变量。但是,当我 keeppenalty.factor
和 remove时family = "binomial"
,它正在运行,但它不再是二元逻辑回归。有谁知道如何修理它?
编辑:由于我没有解决方案并且面临尽快显示结果的压力,我选择使用 LASSO 选择的变量与这三个强制性变量相结合来运行常规 logit 回归。不知何故,我认为这样做会有一个问题......
谢谢!
python - 从python中Lasso Logistic Regression获得的系数确定回归方程?
我进行 Lasso 回归首先进行分类特征选择(参数空间有 900 个特征,Lasso 后减少到 78 个),然后作为线性模型计算某些响应变量。我有根据套索重要的参数的系数。关于如何将其转换为以下类型的线性回归方程的任何想法:
谢谢!
r - 如何在 R 中计算对数预测分数
我正在使用贝叶斯模型平均和贝叶斯套索回归进行预测,我想使用预测对数分数来评估密度预测的准确性。
我将 bms 包用于贝叶斯模型平均,将 monomvn 包用于贝叶斯 LASSO。在 bms 包中,已经实现了计算预测日志分数的函数,但对于 monomvn {bayesian lasso},它没有实现。
我能够通过将每个后验图乘以每个单个观察的相应解释变量来计算套索对象的预测密度,因此我现在有了每个观察的预测密度。
给定预测密度和实现值,我如何估计 R 中的预测对数分数?
最好的
更新(已解决)
在联系了 BMS 包的一位作者之后,这是我的实现:
这里的一个问题可能是,这种实现没有考虑参数的不确定性,因此它可能有利于更大的模型,因为样本中的 SigmaSq 对于大型模型往往更小。
r - 当响应结果未知时如何在 glmnet 中进行预测?
当我过去使用时glmnet()
,我曾经model.matrix()
为. 但是,我现在正在尝试预测数据的二元结果,其中我对每个预测变量都有完整的观察,但我所有的响应条目都是. 当响应变量全部丢失时,该函数似乎不起作用,我一直在尝试使用为. 但是,当我尝试使用该功能时,我不断收到以下错误:x
glmnet(x, y, alpha = 1, family = 'binomial')
NA
model.matrix()
data.matrix()
x
glmnet()
predict()
任何人都可以建议在这种情况下如何在所有缺少响应值的情况下继续前进吗?在阅读了几篇在线文章后,我尝试使用各种稀疏矩阵函数,但似乎都没有。例如:
https://stat.ethz.ch/R-manual/R-devel/library/Matrix/html/sparseMatrix.html