问题标签 [lasso-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R包glmnet中的套索:解决方案不是最优的?
我只是想了解 R 包 glmnet 中实现的套索。我正在拟合数据,但我为我选择的 lambda 得到的解决方案不是最小化套索的标准,例如,如果我以一种方式移动解决方案,我可以获得更小的成本函数。
我理解错了什么?
regression - “mean_squared_error”的负值
我正在使用 scikit 并mean_squared_error
在 cross_val_score 中用作模型评估的评分函数。
我正在使用mean_squared_error
它,因为它是一个回归问题,并且使用的估计器(模型)lasso
是ridge
和elasticNet
。
对于所有这些估计器,我得到rms_score
的是负值。鉴于 y 值的差异是平方的,这怎么可能。
machine-learning - 为什么我会得到一些负值(预测变量)作为回归估计器(Lasso、Ridge、ElasticNet)的输出
对于我的回归问题,我使用 scikit-learn 的 GridSearchCV 来获得最佳 alpha 值,并在我的估计器(Lasso、Ridge、ElasticNet)中使用这个 alpha 值。我在训练数据集中的目标值不包含任何负值。但是一些预测值是负的(大约 5-10%)。我正在使用以下代码。我的训练数据包含一些 Null 值,我正在通过该功能替换它们。
知道为什么我会得到一些负值吗?X,y 和 X_test 的形状为 (20L, 400L) (20L,) (10L, 400L)
python - Python sklearn。为什么我只在第一次收到警告?
我只是第一次收到警告。这是正常的吗?
r - 如何使用套索(lars R 包)从线性模型中获取截距
我很难获得 R 包lars
为我的数据估计的模型。
例如,我创建了一个假数据集 x 和相应的值 y,如下所示:
接下来,我使用 lars 函数训练一个使用 lasso 正则化的模型:
现在我想知道估计的模型是什么(that I know to be: y = 0.5 + 3 * x[,1] + 0 * x[,2]
)
我只对最后一步获得的系数感兴趣:
这些是我期望的系数,但我找不到从中获取截距(0.5
)的方法m
。
我试图检查 的代码predict.lars
,其中的拟合是这样完成的:
我可以看到变量被缩放,并且使用了y
(object$mu) 的平均值,但是我找不到一种简单的方法来获得我正在寻找的截距的值。我怎么能得到那个?
r - glmnet NA/NaN/Inf 中的套索错误
我遇到了 glmnet 的问题,因为我不断收到错误消息
下面我可以使用“iris”数据集复制错误,但这里是我的特定数据的简化代码:
这是您可以轻松复制的内容:
非常感谢大家!
matlab - matlab中使用L1正则化的高效逻辑回归
我正在 matlab 中寻找一个有效的逻辑回归实现。我在matlab中使用了lassoglm。但是当我尝试使用 10000 个具有 1000 个特征和正则化参数为 0.005 到 1 的示例时,它真的很慢。我使用两次交叉验证。从 lambda 0.05 开始,它非常慢并且需要很多时间。
有没有更好的方法?
matlab - 如何从matlab调用python和sklearn?
我需要在 matlab 上调用 sklearn 函数。听说调用numpy函数有些问题,sklearn是基于numpy的。
有没有这方面的指南?
matlab - 在 Matlab 中使用套索进行留一回归
我有 300 个数据样本,每个样本约有 4000 个维度特征。每个输入有一个 5 暗淡。输出在 -2 到 2 的范围内。我正在尝试为其拟合套索模型。我浏览了几篇关于交叉验证策略的文章,例如:Leave one out cross validation algorithm in matlab
但是我看到 lasso 在 Matlab 中不支持省略!http://www.mathworks.com/help/stats/lasso.html
如何使用遗漏交叉验证训练模型并在我的数据集上使用套索拟合模型?我正在尝试在 matlab 中执行此操作。我想获得一组权重,我将能够将其用于未来对其他数据的预测。
我尝试使用 glmnet: http: //www.stanford.edu/~hastie/glmnet_matlab/intro.html但由于缺少适当的 mex 编译器,我无法在我的机器上编译它。
我的问题有什么解决方案吗?谢谢 :)
编辑
我也在尝试使用 MATLAB 内置的套索函数。它有一个执行交叉验证的选项。它输出 B 和拟合统计信息,其中 B 是拟合系数,一个 p×L 矩阵,其中 p 是 X 中的预测变量(列)的数量,L 是 Lambda 值的数量。
现在给定一个新的测试样本,我如何使用这个模型计算输出?
glmnet - glmnet 中用于交叉验证的默认 lambda 序列
有人知道 cv.glmnet(在 R 的 glmnet 中)或 LassoCV(scikit-learn)如何选择他们在交叉验证中使用的一系列正则化常数(lambdas)吗?非常感谢!